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PREFACIO 


Este libro es un manual de Algebra lineal para los estudiantes 
de los Institutos Politécnicos y de las Facultades de Ciencias 
Naturales de las Universidades. Será también útil para el lector 
que desee, de un modo individual, estudiar los conceptos principa- 
les del Algebra lineal en una fuente que no requiere conocimientos 
previos de las Matemáticas superiores. Sólo se Cruel que el lector, 
además del curso elemental de Matemáticas, está familiarizado con 
los elementos de la Geometría analítica. Los conceptos del Análisis 
matemático que se emplean en el libro (la derivada y la integral) 
sólo aparecen en ejemplos que pueden ser omitidos en la lectura sin 
perjuicio para la comprensión del material. 

El capítulo 1 es de carácter introductorio; contiene todos los 
elementos de la teoría de determinantes y de la teoría de sistemas de 
ecuaciones lineales necesarios en lo sucesivo. Los capítulos del 11 
al VI son los principales : exponen un curso breve del Algebra lineal 
propiamente dicha, 

Los cuatro últimos capítulos no se refieren, realmente, al 
Algebra lineal, pero sus resultados se basan en el material anterior 
(«..... y algunas de sus aplicaciones»). Estos capítulos son indepen» 
dientes y pueden ser leídos en cualquier orden (véase el esquema 
de dependencia de los capítulos). 

El capítulo VII está dedicado a la teoría general de curvas y de 
superficies de segundo grado. Completa y profundiza la parte 
correspondiente del curso de Geometría analítica sin pretender a 
sustituirla. 

Poco común para un manual de Algebra lineal, el capítulo 
VIII, dedicado a la teoría especial de la relatividad, ha sido inspi- 
rado, en gran medida, por el curso que P. K. Rashevski dictó en la 
Universidad de Moscú en 1940. Este capítulo puede ser omitido al 
estudiar el Algebra lineal, pero la experiencia muestra que despierta 
generalmente gran interés en los oyentes. 
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El capítulo IX está dedicado a los conceptos principales del 
Algebra tensorial. Tiene más bien carácter de resumen y puede servir 
de introducción a exposiciones más detalladas sobre el mismo tema. 

El último capítulo contiene solamente las nociones más generales 
de la teoría de grupos, cuyo conocimiento es hoy día, indispensable 
no sólo para el matemático, sino también para el ingeniero. Sin 
embargo, la teoría de grupos no €s, ni mucho menos, una parte del 
Algebra lineal; por lo tanto, para estudiarla con cierto detalle, el 
lector debe recurrir a la literatura 

El presente libro equivale, por su contenido, al curso algo 
ampliado que la autora dictó varias veces en la Sección de Química 
Física de la Facultad de Química de la Universidad de Moscú. 
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CAPÍTULO 1 


DETERMINANTES Y SISTEMAS DE ECUACIONES LINEALES 


Este capítulo contiene el material auxiliar relacionado con la 
solución de sistemas de ecuaciones lineales (es decir, de ecuaciones 
de primer grado). Para el estudio de estos sistemas se introduce el 
importante concepto de determinante. Los resultados de este 
capítulo, que tienen interés tanto por sí mismos como por sus 
aplicaciones en la Geometría analítica, son indispensables para la 
comprensión de los capítulos sucesivos del libro. 


$ 1. Sistemas de ecuaciones con dos y con tres incógnitas 


En la solución de una ecuación de primer grado con una incógnita 

ax=b 
se pueden presentar tres casos: 

1. Sia + 0,la ecuación tiene una solución única x =2. 

2.Sia=0yb=0, lA ecuación tiene an conjunto infinito «do 
soluciones: cualquier número real x satisface la ecuación ax =) 
(ya que 0-x = 0) y es, por consiguiente, solución de la misma. 

3. Si a =0, pero b 4 0, la ecuación no tiene soluciones, ya que 
al sustituir x por cualquier número real se obtiene en el primer 
miembro el cero, mientras que el segundo miembro es diferente 
de cero. 

Estos mismos tres casos se pueden presentar al resolver un 
sistema arbitrario de ecuaciones lineales. 

Consideremos un sistema de dos ecuaciones con dos incógnitas: 

0 

max bay = 03. 
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Se llama solución de este sistema a todo par de valores x =« 
e y =8 que, al sustitur por ellos a x y a y, convierten ambas 
ecuaciones en identidades. Para resolver este sistema, multiplique- 
mos la primera ecuación por bz, la segunda por —b, y sumémoslas; 
obtendremos 

x(a1b1—asby) = cxba—cabr - 
De aquí, siendo a1b3—azb, % O, tendremos 


— cbr cab, 
a 0) 
Análogamente encontramos que 
= Ata 3) 
Y abia, * € 


Por consiguiente, en el caso en que 4ba—asb1 + O, el sistema (1) 
tiene una solución única. 

Las expresiones que figuran en los numeradores y en los 
denominadores de los segundos miembros de las igualdades (2) y 
(3) tienen la misma estructura. A saber, consideremos la tabla 
Cuadrada de números 

A les El A 

as ba 
Las tablas de este tipo se llaman matrices. Las líneas horizontales 
de los números que componen la matriz se denominan filas de la 
misma y las líneas verticales se denominan columnas, Los números 
41, 1, Az y bz que componen la matriz se denominan elementos de 
la misma. En nuestro ejemplo nos hemos encontrado con una ma- 
triz cuadrada de segundo orden. La diagonal que va del ángulo 
izquierdo superior al ángulo derecho inferior de la matriz se llama 
diagonal principal de ésta, Los denominadores de las fracciones que 
aparecen en los segundos miembros de las igualdades (2) y (3) 
tienen la siguiente estructura: del producto de los elementos que se 
hallan en la diagonal principal de la matriz A se resta el producto 
delos elementos que figuran ensu otra diagonal, llamada secundaria: 


Arba arbr . 
La expresión así obtenida Jleva el nombre de- determinante de la 
matriz A (determinante de segundo orden) y se-indica como sigue: 
a bi 
dy ba 
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Luego, por definición, 
a bi 

= aba abr. 

0 ba 
En esta notación el numerador de la fracción que figura en el 
segundo miembro de la igualdad (2) representa el determinante 
a bh 
pus Crba—cibr 


que se obtiene del denominador al sustituir la primera columna por 
la columna de Jos términos independientes, mientras el numerador 
de la fracción que aparece en el segundo miembro de la igualdad (3) 
representa el determinante 


aC 
ac 


que se obtiene del denominador sustituyendo la segunda columna 
por la columna de los términos independientes de las ecuaciones 


= Arc 0901 








del sistema (1). 
Hemos encontrado, pues, que 
4h a. 


Estas son 2 para la solución de un sistema 
de dos ecuaciones con dos incógnitas. 


Ejemplo 1. Resuélvase, empleando las fórmulas de Cramer, el sistema de 
ecuaciones 





245) =8, 
d+ yl 
Solución. 
| 8s 28 
a EL o 3 al _-2-4_ 
sd E E==3p =p => 


23] "3-15 
31 
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Consideremos ahora el caso en que 


a Pl = aby a =0. o) 
a ba . 
La igualdad (4) puede ser representada así!: 
a nn 
b.> 


es o los coeficientes de las incógnitas son en este caso propor- 
cionales. Si además se tiene que 

a 
Ca 
también los términos independientes son proporcionales a los 
coeficientes de las incógnitas y tenemos, en realidad, una ecuación 


con dos incógnitas que admite un conjunto infinito de soluciones. 
Finalmente, si 














a h 
0, 
% 5 da 
es decir, si 
as 
CN 


las ecuaciones son, evidentemente, contradictorias y el sistema no 
«tiene solución alguna. 

La solución x =«, y = f del sistema de ecuaciones (1) deter- 
mina el punto de intersección de las rectas 

axtby=c1 y mx+bay =0%. 
a 
a 
por consiguiente, un punto común único. En el caso en que 
LL 
eN 2 
tienen ningún punto común. Finalmente, sies ¿E 

3 


si 





2 % 0, son dos rectas distintas no paralelas que tienen, 


= E A E, las rectas son paralelas y, por consiguiente, no 


A 
=-4, ambas 








2 Aquí y en lo que sigue aceptamos que los denominadores son diferentes 
de cero; el caso en que esto no sea así, considérelo usted mismo. 
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ecuaciones determinan una misma recta y todos sus puntos son 
precisamente «puntos de intersección» de las rectas dadas. 
Consideremos ahora un sistema de tres ecuaciones lineales con 
tres incógnitas 
ax+by+cz =d,, 
ax + bay 4092 = da, s 0] 
a+ bay +csz = de, 
Se llama solución de este sistema a toda terna de números 
x =4, y = $, z = y que convierten las tres ecuaciones en identida- 
des. Multiplicando la primera ceució por a] = baca— baca, 
la segunda por — E <= byey —bcs, la tercera por 
al 








EN 2 aj- 


= brca—bac1 y sumándolas todas, obtenemos 
Aarbacs —arbaca+ ambací —aabrca+ asb1ca—asbaci) = 
= dibacs —dibrca+ dabas —debrcs+ dibrcs—debacs 


(es fácil ver que los coeficientes de y y z serán iguales a cero). De 
aquí, siendo el coeficiente de x diferente de cero, obtenemos 
Z (6 
beta 
dema la estructura que tiene la expresión que aparece en el 
denominador del segundo miembro de la igualdad (6). Considere- 
mos con este fin la tabla cuadrada (la matriz de tercer orden) 





a bc 
As fa be col. 
as Da cs 


El denominador de la fórmula (6) representa la suma algebraica 
de seis términos cada uno de los cuales es un producto de tres 
elementos tomados uno a uno de cada fila y de cada columna de la 
matriz A, con la particularidad de que el signo más lo tienen el 
producto de los elementos que pertenecen a la diagonal principal 
y los dos productos de los elementos que forman en la matriz 
triángulos (isósceles) de base paralela a la diagonal principal: 
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4 6 es 
% Cs 
a; 3 Ca 


mientras que el signo menos lo tienen el producto de los elementos 


pertenecientes a la diagonal secundaria y los dos productos de los 
elementos que forman triángulos de base paralela a la diagonal 
secundaria: 


a, OL CL 


al 02 


¡ a b3 Ca 


Una expresión de este tipo se llama determinante de la matriz 4 
(determinante de tercer orden) y se indica como sigue 


a ha 

az Dz Ca 

ds bs Cs 

Es decir, por definición, 
a1-bi e). 

Dal ba. da] = abre + abs + abr 

as ba Cs 





—asbacs ambito —asbace 
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La expresión que figura en el numerador del segundo imiembro 
de la fórmula (6) se obticne del denominador sustituyendo cada 
una de las letras a por lá letra d con el mismo Índice, es decir, 


(62) 





Se puede demostrar análogamente que, siendo D 0, del 
sistema (5) se deducen las igualdades 


D, D, 
r=h y 2%, Y) 


donde D;, i = 1, 2,3, es el determinante que se obtiene del determi- 
nante D sustituyendo su ¡-ésima columna por la columna de los 
términos independientes. Estas son las fórmulas de Cramer para 
un sistema de tres ecuaciones con tres incógnitas. 


Ejemplo 2. Resuélvase empleando las fórmulas de Cramer el sistema de 
-uaciones 


ec 




















x+2y4dz 

xdy+ 

x+y+2=3 

Solución. 
í 28 

Dalt -3 2|=-343+449-2-2=9 5 0; 
1 1 
2 208 

D=|5 -3 2|=-214+15+12427-10-14=9, 
3 11 
1.073 

D=- . 5 2|=54+144+9-15-7-6=0, 
1 031 
8 20%) 

Da=|1 -3 S|=-947+104+21-6-5= 
13 
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Por consiguiente, 
Ds Da 


=%A = Dr 
ql y = 20 y =p =2 


Con el fin de introducir el concepto de determinante de orden a, 
consideremos de nuevo los determinantes de segundo y de tercer 
órdenes: 








a b 

E = ajb¿—aabr (8) 
y 

a boca 

ds ba cal = aibecs+ambaci+ abre —asbacr— 

A ba ca —agbrca—arbaca. (9) 


Vemos que el determinante es la suma algebraica de todos los 
productos posibles de sus elementos formados de modo que haya 
uno de cada fila y uno de cada columna. Cada uno de estos pro- 
ductos se llama término del determinante. Coloquemos los factores 
de todo término del determinante de segundo orden en el orden de 
secuencia de las columnas del determinante: 


arb:—asbr . 


Consideremos las ordenaciones correspondientes (permutaciones) 
de los índices inferiores (que indican el número de las filas): 


1,2 y 2,1. 


En el primer producto los índices aparecen en el orden de cre- 
cimiento y el producto correspondiente figura en el determinante 
con el signo más; en el segundo producto los Índices forman, 
como suele decirse, un desorden o una inversión 2, 1 y el término 
correspondiente aparece en el determinante con el signo menos. 

El determinante de orden tres tiene scis términos. Si colocamos 
los factores de cada uno de ellos en el orden de secuencia de las 
columnas, los Índices inferiores de los términos que aparecen con 
el signo más formarán las permutaciones 


1,2,3; 2,3,1 y 3,1,2. 


Consideremos tres pares de Índices 1, 2; 1, 3 y 2, 3 correspon- 
dientes a la primera permutación 1, 2, 3; en cada uno de estos 


$ 1. Sistemas de ecuaciones con dos y con tres incógnitas 2 





pares los números aparecen en el orden de crecimiento; se dice que 
esta permutación tiene cero inversiones. La segunda permutación 
2, 3, 1 origina tres pares de índices: 2, 3; 2, 2133, 1 y dos de ellos 
(a saber, 2, 1 y 3, 1) forman inversiones. La tercera permutación 
3, 1, 2 origina tres pares de índices — 3,1; 1, 2 y 3, 2— y dos de 
ellos — 3, 1 y 3, 2 — forman inversiones. 

A los productos que aparecen.con el signo menos les correspon- 
den tres permutaciones de los Índices inferiores: 


3,2,1; 2,13 y 1,3,2; 








es fácil ver que la primera contiene tres inversion , 233, 1 
y21, mientras que la segunda y tercera, una inversió; , 1y3,2, 
respectivamente. Por: consiguiente, con el signo más aparecen aque- 
llos términos que contienen un número par de inversiones en la per- 
mutación de los índices inferiores y con el signo menos Aparecen 
aquellos para los cuales este número es impar. 

Escconveniente para lo sucesivo introducir unas nuevas notacio- 
nes para lós determinantes de segundo y tercer órdenes: 





4, 

ata], ao a 
aa. 0 0 a|, 
a dm ds 





donde todos los elementos del determinante se designan por una 
misma letra a con dos índices, de los cuales el primero corresponde 
al número de la fila y el segundo, al número de la columna. Enton- 
ces, se tiene 








a AA 
OS 

y 
Mí 2 lí 
dm de Gas |= ) +0110p0015, 
das des ea 


donde el signo más lo llevan aquellos productos en los cuales la 
permutación fa, dz, ¡y es par (es decir, tiene un número par de inver- 
siones) y el signo menos lo lleyan aquellos, en los cuales ésta es 
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impar. Esto mismo se puede escribir así: 


Wu 0 4 
Aa Or aj = D(—1Y 01012019, 
da da dy 


donde « es el múmero de inversiones en la permutación h, da, ly 
de los primeros índices (los segundos índices están en su orden 
natural) y la suma se extiende a todas las seis permutaciones i,, fa, ía 
de los tres números 1, 2, 3. 


$2. Permutaciones y trasposiciones. Determinante 
de orden 


Sean dados n elementos 41, a, ..., 4 (que pueden ser, por 
ejemplo, los números 1, 2, 3, ..., 1). Como se sabe, se llaman 
permutaciones de n elementos a todas las ordenaciones posibles de 
estos elementos. Con n elementos se puede formar un total de n! 
permutaciones (demuéstrese esto). 

Si un par a;, az de elementos de una permutación aparece en 
ésta de modo que el elemento con mayor índice antecede al clemen- 
to con menor índice, se dice que estos elementos forman una 
inversión. Supongamos que debemos encontrar el número de inver- 
siones que presenta una permutación cualquiera fotmada por los 
números naturales 1, 2, 3, ....., n(éstos pueden ser los Índices de los 
elementos 41, do, . . ., 41). Para ello se puede proceder así. Calcule- 
mos primero el número de elementos que anteceden a la unidad; 
todos estos elementos, y sólo ellos, forman inversiones con la uni- 
dad. Tachemos después la unidad y calculemos el número de 
elementos que anteceden al dos; éstos serán todos aquellos elemen- 
tos que forman inversión con el dos (sin tomar en consideración la 
unidad tachada que también puede formar una inversión con el 
dos; pero en dicho caso esta inversión ha sido ya fijada anterior- 
mente). Tachemos luego el dos y calculemos el número de elemen- 
tos que anteceden al tres, etc. Sumemos todos los números obteni- 
dos; esta suma será igual precisamente al número total de inversio- 
nes. El número de inversiones en la permutación 1, ía, ..., Ín Se 
indica así: ffs, fa, :.., in]. Por ejemplo, * * 


R, 5,1,4,7,3,6] =240+3+14+0+1=7. 
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Las permutaciones que presentan un número par de inversiones 
se llaman pares y las permutaciones que presentan un número impar 
de inversiones se llaman permutaciones impares. 

Sea dy, 02, --.> O, --:3 0%, +», Gn una permutación dada de 
aí elementos. Pongamos cada uno de los elementos a, y as en el 
lugar del otro; obtendremos así la permutación '4j, 42, ..., 
Uhr 22, Oy <> -, Gn. Esta opermción destentlado de dos elementos de 
una permutación se llama 

Teorema 1. Un irmpotiidn pla le paid do la permutación 
(es decir, una permutación par se hace impar y una permutación 
impar se hace par). 

Demostración; Consideremos primero el caso en que se traspo- 
nen dos elementos consecutivos a y $ de una permutación 


41, Ga, +3 01,0% Br Dry bo, ..., Dm. (10) 


Después de la trasposición de los elementos « y $ obtendremos la 
permutación 


Gr, Ga, ..., Gp, B,%, Dr, Da, -.., Dm. an 


Puesto que las permutaciones (10) y (11) difieren sólo en la posición 
recíproca de los elementos « y $ (y como quiera que la posición 
recíproca de cada uno de estos elementos con otro cualquiera, 
así como la posición recíproca de dos cualesquiera de los restantes 
elementos, es la misma), resulta que el número de inversiones en la 
permutación (11) es mayor o menor en una unidad que el número 
de iriversiones en la permutación (10) y, por consiguiente, una de 
estas permutaciones es par, miéntras que la:otra es impar. 

Consideremos ahora el cáso general. Supongamos que en la 
permutación dr, ..., 43, %, Cr, « ..,C£, B, br, ... ., Da; se trasponen los 
elementos « y $ entre los cuales figuran: otros k elementos Ci, 
Ca,» » -, €x. Podemos realizar la trasposición de los elementos « y £ 
mediante varias trasposiciones de elementos consecutivos: traspon- 
gamos primero « con c,, después con cz, etc. y, finalmente, con 
cg (realizando así k trasposiciones de elementos consecutivos); 
traspongamos después « y $ (una trasposición más) y, finalmente, 
traspongamos $ consecutivamente Con Cx, Ck..1, €tc. y 1 (otras k 
trasposiciones de elementos consecutivos). En definitiva £ ocupará 
el lugar de « (y viceversa). Cada una de estas trasposiciones altera, 
como hemos visto, la paridad de la permutación. Puesto que ésta se 
altera 2k+-1 veces, es decir, un número impar de veces, resulta que 
una permutación impar se hace par y una par se hace impar. 
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Corolario. El número de permutaciones impares de n elementos 
es igual al múmero de permutaciones pares (y, por consiguiente, es 
igual a n!/2). 

Demostración, Supongamos que entre las n! permutaciones 
de n elementos hay p pares y q impares. Realicemos en cada una de 
las permutaciones páres una misma trasposición, trasponiendo, por 
ejemplo, los dos primeros elementos. Toda permutación par se 
convertirá en una impar y es evidente, además, que todas las p 
permutaciones impares obtenidas de esta forma serán diferentes. 
Puesto que, por hipótesis, el número total de permutaciones impares 
de n elementos es igual a q, resulta que p == q. Podemos comprobar 
de la misma. forma que, al contrario, p=> 4. Por consiguiente, 
p=4g 

Demos ahora la definición general de un determinante. Sea dada 
una tabla cuadrada (una matriz de orden n) 





Los números aj se llaman elementos de la misma; las líneas 
horizontales de elementos se llaman filas y las verticales, columnas 
de la misma. Se llama determinante de esta matriz (determinante de 
orden 1) 'a la suma algebraica de todos los productos posibles de 
elementos formados de modo que haya un factor de cada fila y uno 
de cada columna de la matriz A, Si en cada uno de estos productos 
(términos del determinante) los factores se colocan en el orden de 
secuencia de las columnas, se toman con el signo más aquellos 
productos para los cuales es par la permutación formada por los 
primeros Índices y con el signo menos aquellos para los cuales esta 
permutación es impar. Resumiendo: 


Gin O... Gra 
an | PI 6 yr «<> Co 








Anx Gra 
donde la suma se extiende a todas las permutaciones posibles í1, 
da, » -, In delos n números 1, 2,3, ..., 1: El determinante de orden 
n contiene n! términos, ya que el número de permutaciones de 1 
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elementosesigual a n! Debido al:corolario del teorema 1, justa- 
mente la mitad de éstos, es decir, m!/2 términos, aparecen en el 
determinante con el signo más y la misma cantidad, con el signo 
menos, 


$ 3. Propiedades de los determinantes 


Con el. crecimiento del orden del determinante aumenta rápida- 
mente el número de sus elementos. Así, el determinante de orden 
cuatro consta de 24 términos, el determinante de orden cinco, de 
120, el determinante de orden seis, de 720 términos, etc. Por lo 
tanto, resulta prácticamente imposible calcular los determinantes 
de orden superior a tres valiéndose sólo de Ja definición. Para poder 
calcular estos determinantes, deberemos estudiar sus propieda- 
des. Demostraremos ante todo una proposición auxiliar. 

Lema (del signo del término de un determinante). El producto 
Glue mx, Gparece en el determinante de orden n con el 

perl por la expresión 


(Mio as oo olas Kaos Kal 


diremos simplemente que aparece con el signo 
(— IDU ++ hal Ha Lo +++ 


Demostración. Observemos, ante todo, que colocando dos 
factores del producto dx, Gjk, --- Gz, Uno en lugar del otro, 
$e provoca una trasposición tanto en los primeros como en sus 
segundos Índices y, por consiguiente, se altera la paridad de cada 
uno de los números 


fla des <> da] Y [Ki Ko, --.> Ko], 


ET que la paridad de la suma de éstos [ix, ía, ..., ¿n] + 

+ [Kx ka, ..., Kn] se conserva. 

Sea dado el producto fria +»: Gx, . Coloquemos sus fac» 
tores, mediante una serie de trasposiciones, de modo que los seguñ- 
dos Índices aparezcan en su orden natural, Con este fin reálicemos 
primero una trasposición tal que en la primera posición aparezca 
el elemento de la primera columna, después una trasposición tal 
que en el segundo lugar aparezca el elemento de la segunda colum- 
na, etc. (Así, por ejemplo, el producto a45614052021033 se transforma 
consecutivamente €n 221015901509, después en G21452014%a5033, En 
nsAsofizaasA, 2 y, finalmente, en an as2ag981045.) Si después de colocar 
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los segundos índices en orden de crecimiento los primeros forman 
la permutación [m, rm, . .., mp], esto significará, por definición, 
que el término considerado aparece en el determinante con el signo 
(— Io mo 0.1), Pero como durante la trasposición de los 
factores no ha cambiado la paridad de la suma [ir, la, ..., ix] + 
+[k1, Ka, . . ., kn] del número de inversiones en los primeros índices 
y del número de inversiones en los segundos índices, resulta que la 
paridad de esta suma en la ordenación inicialde los factores coincide 
con la paridad del número [m,, ma, . . ., mn] que representa el número 
de inversiones correspondiente a la permutación de los primeros 
índices en la ordenación definitiva, cuando los segundos índices 
forman cero inversiones. Por consiguiente, 
E 


y esto demuestra nuestra afirmación. 


Ejemplo 3. Determinese el signo que corresponde al producto aya ys0g 03024 
en el determinante de quinto orden 


A Gs dy ds 


e 
da Gn da 0 aa 

la 

La 


Peor? 


B, 4, 5,1,2)=3+3=56, 
(2,3,1, 5, 4] =2+1=3; 
(n= (IO Le 
El producto considerado aparece en el determinante (12) con el signo menos. 
Propiedad 1 (paridad de las columnas y de las filas. de un 
determinante). El valor de un determinante no varíe si éste se tras- 
_pone, es decir, si se cambia cada una de sus filas por la columna del 
Demostración. Consideremos los determinantes 
An 2 .i. Gn 
Do|ta dm... am 





2 





Debemos demostrar que D' = D. 

Todo término del determinante D es un término del determi- 
nante D', ya que sus factores siguen permaneciendo en el determi- 
nante D' en distintas filas y en distintas columnas; recíprocamente, 
todo término del determinante D' es al mismo tiempo un término del 
determinante D. Por consiguiente, ambos determinantes represen- 
tan la «suma algebraica» (es decir, una suma en la que algunos 
sumandos se toman con el signo menos) de los mismos términos 
de tipo Ark, Uy... . La diferencia estriba solamente en 
que en el determinante D los primeros índices corresponden a los 
números de las filas y los segundos a los números de Jas columnas, 
mientras que en el determinante D' sucede al revés. Pero, según el 
lema del signo del término de un determinante, el signo de este 
producto tanto en el primero como en el segundo determinante 
será el mismo: 

E sed 
luego, D' 

Propiedad 2. Si se camblóm entre sí dos filas o dos columnas de 
un determinante, el determinante cambia sólo de signo, pero su valor 
absoluto no varía. 

Demostremos esta afirmación, por ejemplo, en el caso de las 
columnas. Cambiando entre sí la p-ésima y la g-ésima columnas del 
determinante 


alió, 





a; 





Mm Óra +... Gap... Gig... Cin 





A E 
obtendremos el determinante 
E PE 
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Todo término del determinante D, es también un término del 
determinante D», ya que sus factores siguen permaneciendo en el 
determinante D, en 2 distintas filas y en distintas columnas, y vice- 
versa. Tomemos un término cualquiera 

RS A 
del determinante Di. Puesto que sus factores aparecen en el orden 
de secuencia de las columnas de D,, resulta que este tés 
en el determinante D, con el signo (— 1)''ota li 
determinar el signo de este témmino en el deteniinante Da, colo- 
quemos sus factores en el orden de secuencia de las columnas 
de Da: 


CAGA ++ Giyg «<< Qiyp ++ Gian 
(el elemento a;,, pertenece a la p-ésima columna del determinante 
Ds y el elemento ay a la g-ésima columna). Los primeros Índices, 


tanto en el determinante D¿ como en el determinante D,, correspon- 
den a los números de las filas; por lo tanto, el producto. ¡ponslderado 











aparece en el determinante Da con el signo (— Ippo». cl on lo oe dd, 
Pero la permutación he da +. le dor 1 ln Se 2d de la 
permutación Mela co dos de "mediante una trasposición 





y, por consiguiente, los números 


lim day «+ dos «<> do << dh] y 
[ito des —<<s dq 001 dps +01 10) 


son de paridad distinta. Luego, todo término del determinante 
D; aparece en el determinante Da con el signo opuesto y, por con- 
siguiente, Dz = —D;. 

Para demostrar la proposición Correspondiente a las filas, pase- 
mos a los determinantes traspuestos D; (el determinante traspuesto 
de D;) y D; (el determinante traspuesto de Ds). Si el determinante 
Dase obtiene de D, cambiando entre sí la p-ésima y la g-ésima filas, 
resulta que-D; se obtiene de D; cambiando entre sí la p-ésima y la 
g-ésima columnas y, por consiguiente, D¿ = —D%. Pero Dj =D, 
y D; = Da; Juego, Da = —D1. 

Corolario. Un determinante que tiene dos filas o dos colurmas 
idénticas es igual a cero. 

Para demostrar esto, cambiemos entre sí las filas (o las colum- 
nas) idénticas del determinante D; claro está que el determinante 
en este caso no varía. Pero, como según la propiedad 2 debe cam- 
biar de signo, resulta que 1D) = —D, de donde se tiene que D = 0. 
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Propledad 3.. S1 se multiplican todos los elementos de una fila o de 
una columna de un determinante por un mismo mímero, el valor del 
determinante queda multiplicado por este mismo número. 

Realicemos la demostración, por ejemplo, para el caso de las 
columnas. Si todos los elementos de la k-ésima columna del deter- 
minante 








O a 
Da|[m % 
Am Cn 
se multiplican por c, se obtiene el determinante 
CO .-- Gr 
CO 0 a 
A 
igual a 
E(—I)Mo tn dra +. (0814) >< 0 Gn = 
=c Y (-IM te Oralia -. Opk > On = CD. 





propiedad correspondiente a las filas se demuestra fácilmente 
pd a los determinantes traspuestos. 

Por consiguiente, un factor común de todos los elementos de una 
fila o de una columna de un determinante puede ser separado como 
el factor del determinante. 

Corolario, Un determinante con dos filas o dos columnas propor- 
cionales es igual a cero. 

En efecto, separando el «factor de proporcionalidad» de la 
fila o de la columna como factor del determinante, obtenemos un 
determinante con dos filas o dos columnas idénticas que es igual 
a cero debido al corolario de la propiedad 2. 

Propiedad 4. Si todo elemento de la k-ésima columna de un 
determinante viene dado como la suma de dos sumandos: aj = biu+ 
+ Cin, es decir, si 

My Gp... butt 


D=|%m % DaxHCor 








Am Gr 
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se puede representar D como la suma de dos determinantes en la forma 
siguiente: 


=D1+D». 





Una afirmación análoga es válida también para las filas. 
La demostración resulta de la igualdad: 


D= Y (—Llete--«hl ata... (OIJ COA) >> On = 
= E (Dio tn» ajxtna ¿40 Art 
+ Eta + Mn = Dit Da. 


Observación. Es fácil ver que tiene eh incluso la siguiente 
afirmación más general: Si todo elemento de la k-ésima columna de 
un determinante D viene dado como la suma de p sumandos: 
an=ah+ah+ ... +af,, el determinante D puede ser representado 
como la suma de p determinantes: 


My la... ae 
ly a 








E 


EN 








A 


Corolario. El valor de un determinante no varía si a todos los 
elementos de una de sus filas o una de sus columnas cualquiera se 
suman los elementos correspondientes de la linea paralela diriicica 


dos por un mismo número. 
Efectivamente, sea dado el determinante 
EA A EE 





D= m0 





An Or 
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Sumando a los elementos de su p-ésima columna los elementos 
correspondientes de la q-ésima columna multiplicado por un mis- 
mo número e, obtenemos el determinante 

Ay Ma... jhC0y 


ay Cay 








A A A A 


En virtud de la propiedad 4, el determinante D, es igual a 





(el segundo sumando es igual a cero, ya que representa un deter- 
minante con dos columnas proporcionales). 


$ 4. Menores y complementos algebraicos 


Se llama menor Mix del elemento ay de un determinante D 
de orden n al determinante de orden n—1 que se obtiene supri- 
miendo en D la ¿-ésima fila y la k-ésima columna. 

Se llama complemento algebraico Aj del elemento ay a su 
minor tomado con el signo (—1)+*: 


An = (+4 Mu 


Teorema 2. Si en un determinante D de orden n todos los elemen- 
tos de la k-ésima columna (fila), a excepción de uno, son iguales 
a cero, el determinante es igual al producto de esté elemento diferente 
de cero por su complemento algebraico. 

Demostración. Consideremos primero el caso en que todos los 
elementos de la primera columna del determinante D, a excepción 


32 Cap. 1. Determinantes y sistemas de ecuaciones lineales 





de a1,, son iguales a cero: 
Gm G2 ..- Gm 
D=j|0 % ..- Oj 





O Gs... Gnp 


Todo término del determinante D contiene exactamente un ele- 
mento de la primera columna; pero como todos estos elementos, 
a excepción de a, son iguales a cero, resulta que se-anulan todos 
aquellos términos del determinante D en los cuales figura no el 
elemento a, sino otro elemento cualquiera de la primera columna. 
Por consiguiente, 


Ds Y (Dotes ol aaa ++ Gano 
donde iz, ..., in toman los valores 2, 3, ..., n. El elemento 41 
puede ser separado como factor y puesto que la unidad, que apa- 
xece en la posición primera, no forma inversión alguna, se tiene 
El, da, +2, da] = lb, +.» 1h]; Juego, 

D= au E (—1)Me 0 «bl aya... Gr, 
donde la suma se extiende a todas las permutaciones posibles 
la, la, ««., da de los números 2, 3, ..., n. Puesto que la suma 

E (Dir bl ja «o 
es igual al determinante de orden n—1 que se obtiene de D supri- 
miendo la primera fila y la primera columna, es decir, es igual 
a My, y puesto que Ay = (—1)*! My, = My, resulta que 

D =4u Mi = Gn Án. 

Consideremos ahora el caso general en que todos los elementos 
de la k-ésima columna del determinante D, a excepción de 4, 


son iguales a cero, es decir, el caso en que el determinante es de la 
forma 
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Traslademos la ¡ésima fila-del determinante D a la primera 
posición trasponiéndola sucesivamente con la fila (1-=1)ésima, 
con la fila (¿—2)ésima, etc. y, finalmente, con la primera fila.'Esto 
requiere ¿-—- 1 trasposiciones de filas y en cada una de estas tras- 
posiciones el signo del determinante varía. Traslademos después 
la k-ésima columna del determinante D a la primera posición 
trasponiéndola sucesivamente con la columna (k—1)-ésima, con la 
columna (k-—2)-ésima, etc. y, finalmente, con la primera columna. 
Esto requiere k—1 trasposiciones de columnas y en cada una de 
estas trasposiciones el signo del determinante también varía. En 
definitiva, obtendremos el determinante 


Gx Gn ..- Gm 


D= 10 


0 4 








que difiere del determinante D en el signo (—1)'+*-3, Pero, como 
acabamos de ver, el determinante D, es igual al producto de az 
porel determinante de orden n—1 que se obtiene de D suprimiendo 
la primera columna y Ja primera fila o, que es lo mismo, por el 
determinante que se obtiene de D suprimiendo la k-ésima columna 
y la ¿-ésima fila, es decir, 


Di= aj Mu 
y, por consiguiente, 

D = (IPD, = (1) au Mu = ax Am. 

El teorema demostrado permite, empleando además el coro- 
os la propiedad 4, calcular los determinantes de cualquier 


Ejemplo 4, Calcúlese el determinante de quinto orden 


20 1 31 
11 2 23 
Da[| 14 0-1s|. 
Su 2 12 
12 -1 31 


2530 
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Solución. Restando do la primera columna del determinante D la tercera 
duplicada, de la cuarta la tercera triplicada y de la quinta la tercera, obtenemos 
o 1.0.0 


A 51-41 
.s 1 2-4 1 ie 4 E E 
Def 14 0-1 S[=asp= IDA, A 1p 
-4 1 3-8 -1 $ 4 E 
32-16 2 
En el determinante obtenido de orden cuatro procederemos de la misma 
forma continuando haciendo a la primera columna la 
cuarta multiplicada por , estemos dela segunda Colurana la cuarta y are- 
guemos a la tercera columna la cuarta multiplicada por 4: 
0.0. 01 LA 
2-1 19 he 
D= = aut = DAY 2-12. 
9 2-2 -1 
13 0-14 








.L.2X0.M 2 


mos llegado a un determinante de tercer orden que puede ser calculado 
7 directamente o blen bien reduciéndolo a un determinante de segundo orden: 
Ar p 


26 -1 19 
4 02% 
Bn 08M 


por consiguiente, D = 264, 


= ógAy > DE mee] 











a 13 
13 > ls a >> 
= 2(301—169) = 264; 





$ 5. Desarrollo de un determinante por los elementos de 
una fila o de una columna 


Teorema 3. Todo determinante es igual a la suma de los productos 
de los elementos de una de sus filas ¿col cualquiera por los 


correspondientes complementos 
Demostraremos que para ualesquieea 1 i, k se tiene 
Gu Om .-- Om 
D=|%m % --- |= a An+an Án+...+anÁin 





An 02... Gan 
(desarrollo por los elementos de la ¿ésima fla) y 
D > GgÁhlada +. - + + Omán 
(desarrollo por los elementos de la k-ésima columna). 
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Para realizar la demostración observemos, ante todo, que, dados 
dos determinantes que difieren uno del otro sólo en los elementos de 
una columna (fila), los complementos algebraicos de los elementos 
de esta columna (fila) son los mismos en ambos determinantes, 
ya que al calcular estos complementos se suprime precisamente la 
columna (fila) en la que difieren Jos determinantes. 

Demostremos ahora que para el determinante D es válido, por 
ejemplo, el desarrollo por los elementos de la k-ésima columna. 
Con este fin representemos el determinante en la forma siguiente: 


1 da 
D=|%m % 





A 


(aquí todo elemento de la k-ésima columna viene dado como la 
suma de n sumandos y n—1 de estos sumandos son iguales a cero). 
Según la propiedad 4 (véase la observación de la pág. 30), se tiene 
D=D+Di+...+Da, 
donde 
Ga a... Oi... Otn 
D=|%u % 


rx Ora 











ln la 
El determinante D, es igual al producto del elemento ay; por su 


complemento algebraico en este determinante. Sin embargo, puesto 
que el determinante D, difiere del determinante D sólo en la 
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k-ésima columna, este complemento algebraico coincide con el 
complemento algebraico Az del elemento ayu en el determinante D: 


Di = Arg Áre + 


Análogamente, 
Da = Or Aox, - +, Dn = OnkÁnk + 
Hemos demostrado que 


D= ad + OKA + Onk An > 


Éste teorema puede ser también empleado para el cálculo de 
los determinantes ya que permite reducirlos a determinantes de 
órdenes inferiores. 


Ejemplo 5. Calcúlese el determinante de orden cuatro 


51 -4 1 
pS 
-4 1-8 -1f 
32 6 2 


Solución. Desarrollemos el determinante, por ejemplo, por los elementos 
dela primera fila: 




















4-1 5 
D=SCSIcCIala 8 14 
2 €. 2 
12105 1405 
+IENa] e 8 1 EOEDA|-A 1 1 
3.6 2 su 2 
141 
+11 e 1 | coco. 
32.6 





=- 370415412433 = 264. 


Teorema 4. La suma de los productos de los elementos de cual- 
quier fila (o de cualquier columna) de un determinante por los comple- 
mentos algebraicos de los elementos correspondientes de una línea 
paralela es igual a cero. 
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Demostración. Sea dado un determinante 
OS 
D=|%1 0 


Ar Ora 


Consideremos otro determinante D, que difiere del determi- 
nante D sólo en que su k-ésima columna repite la ¡-ésima 














El determinante D, es igual a cero (según el corolario de la propie- 
dad 2). Desarrollémoslo por los elementos de la k-ésima columna; 
tendremos 

Di = Udu+anÁn + > o +OntÁnk 
donde 4yx son los complementos algebraicos de los elementos de 
la k-ésima columna del determinante D, que al mismo tiempo son 
los complementos algebraicos de los elementos de la k-ésima colum- 
na del determinante D, ya que el determinante D, difiere del 
determinante D sólo en la k-ésima columna. Luego, para todo 
iy todo k x ¡se tiene 

GuÁn+ OA. . +0 An = 0. 
Análogamente, para todo i y todo k x* ¡ se tiene 


Ann +arA”+ +. +GínÁga = 0. 


$ 6. Sistemas de n ecuaciones lineales con n incógnitas 


Consideremos un sistema de n ecuaciones lineales con n incóg- 
nitas 
px ajax... ypXp = Dr, 
AmXi+ 022x204. Hank = Da, (13) 








A+ XRO = Da 
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Se llama solución del sistema (13) todo conjunto de valores de 
las incógnitas Xy =%1, Xy =4%a, -..» Xa = %n que al ser introducido 
en las ecuaciones convierte todas éstas en identidades. Supongamos 
que el determinante formado por los coeficientes de las incógnitas 
del sistema (13) es diferente de cero: 


Gh Gm... Gn 





am O. 
Multipliquemos por A. la primera ecuación del sistema, por Am 
la segunda, etc., por Am la última y sumemos todas las ecuaciones. 
Obtendremos la ecuación 

x(auÁn+anón+.--+am Am) + 

+x(0mAn+tamán+ +. +amÁm)d+ +... 
PX An + A+ + En Án) = 
= bjAytbidn+..+drÁm, (14) 

es decir, 

x1D =biAu+brAdn+..-+bnÁm, (15) 


ya que los coeficientes de las incógnitas Xa, Xa, .. ., Xy comprendi- 
dos en los paréntesis de la ecuación (14), son iguales a cero en 
virtud del teorema 4 y el coeficiente de x, es igual a D debido al 
teorema 3. Además, para el segundo miembro se tiene 


biAu+biÁn+...+bnÁm =Dr, 


donde D, es el determinante que se obtiene de D sustituyendo su 
primera columna por la columna de los términos independientes. 
(En el segundo miembro de las ignaldades (14) y (15) aparece el 
desarrollo del determinante D, por la primera columna.) Análoga- 
mente a la ecuación (15) obtenemos 


xD =Ds, -.., XD = Da, (15a) 


donde D;, es el determinante que se obtiene de D sustituyendo la 
¡-ésima columna por la columna de los términos independientes. 

El sistema formado por las ecuaciones (15) y (15a) es un corola- 
rio del sistema (13). Hemos demostrado, por consiguiente, que el 
sistema (13) tiene solución, que ésta será también solución del 
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sistema (15) y (15a) y que 
=% A es (16) 


Las fórmulas (16) se llaman fórmulas de Cramer. 

Realizando la sustitución directa de estos valores de las incógni- 
tas en todas las ecuaciones del sistema (13), se puede comprobar 
que forman efectivamente una solución del mismo. 

Teorema 5. En el caso en que D 4 0, no ie 
solución única determinada por las fórmulas de Cramer. 


$7. Rango de una matriz 


Consideremos de nuevo las tablas de números (matrices) pero 
sin exigir ahora que el número de filas de la matriz sea igual al 
número de sus columnas. Introduciremos para estas matrices 
(rectangulares) el importante concepto de rango. 

Consideremos una matriz rectangular formada por m filas y n 
columnas (una [mXm]-matriz). Sea k «<m y k «<n. Fijemos en 
esta matriz cualesquiera k filas y k columnas. Con los elementos que 
figuran en los cruces de las filas y de las columnas fijadas se puede 
formar un determinante de orden k. Todos los determinantes de 
este tipo se llaman menores de esta matriz. Es obvio que de 'una 
[mXn]-matriz se puede formar C;,«Ck menores de orden k. Por 
ejemplo, dada la matriz 


32 12 
4A=|2 0-1 1 
04 51 


se puede formar C¡+Cj = 12 menores de orden uno que vienen 
a ser los propios elementos de la matriz 4, se puede formar 
4-03 = 6-3 = 18 menores de segundo orden 





AE 
lado sl lo ale la sb le ale dh 
lalo sb lo alle sb la ab ls al 
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y se puede formar Cj-C3 = 4 menores de tercer orden: 








32 1 3221 pp 12 2 12 
20 -11, 12 0 1], -1 1], j0 —1 Af. 
04 5 0.41 3. Y 4 5 4 








Es fácil comprobar que todos los menores de tercer orden de la 
'matriz Á son iguales a cero y que no todos los menores de segundo 
orden son iguales a cero (el primero de Jos menores escritos de 
orden dos ya es diferente decero). En este caso diremos que el rango 
de la matriz 4 es igual a 2. 

Se llama rango de una matriz el orden máximo de sus menores 
diferentes de cero. 

Por consiguiente, si el rango de una matriz es igual a r, entre los 
menores de esta matriz existe al menos un menor de orden r dife- 
rente de cero mientras que todos sus menores de orden r+-1 o de 
orden superior son iguales a cero. Indicaremos por r(4) el rango 
de la matriz A. 

Se llaman transformaciones elementales de una matriz las si- 
guientes transformaciones de la misma: 

1. La trasposición, es decir, la sustitución de toda fila por la 
columna del mismo número y viceversa, 

2. El cambio entre sí de dos filas o de dos columnas. 

3. La multiplicación de todos los elementos de una fila o de 
una columna por cualquier número £ diferente de cero, 

4. La adición a todos los elementos de una fila o de una colum- 
na de los elementos correspondientes de una línea paralele multi- 
plicados por un mismo número. 

Teorema 6 (sobre las transformaciones elementales). El rango 
de una matriz no varla en las transformaciones elementales. 

Demostración. Consideremos por separado cada una de las 
transformaciones. En los tres primeros casos muestra afirmación 
es casi evidente: 

1. Según la propiedad 1 de los determinantes, todo menor de la 
matriz traspuesta es igual a uno de los menores de la matriz dada 
y viceversa. 

2. Cambiando entre sí dos filas o dos columnas de la matriz A, 
obtenemos una matriz nueva en la que todo menor es o bien igual 
a cierto menor de la matriz A o bien difiere sólo en el signo de un 
menor de la matriz A. 


$ 7. Rango de una matriz a 





3. Al multiplicar todos los elementos de una fila o de una 
columna de una matriz por un número c, una parte de sus menores 
no varía, mientras que los demás se multiplican por c; pero como 
€ 0, el orden máximo de los menores diferentes de cero de esta 
matriz continuará siendo el mismo. 

4, Consideremos la matriz B que se obtiene de la matriz A 
agregando a todos los elementos de su ¡-ésima columna los elemen- 
tos correspondientes de la k-ésima columna, multiplicados por e: 





Omx Ona ++ Op + Ok <<< Gn 


Ma Or... AURCO 0. 1% 0 Or 





Om Ama .-. GOmiCOmk ... Omk ==» Gmn 


Supongamos que el rango r(4) de la matriz A es igual a r. 
Demostremos que el rango de la matriz B es no mayor que r. Para 
ello es suficiente probar que todo menor de orden mayor que r de 
la matriz B es igual a O. Sea D un menor de orden mayor que r de 
la matriz B. Si D no contiene elementos de la ¡-ésima columna, es 
igual exactamente al menor correspondiente de la matriz A, es 
decir, es igual a O por ser un menor de orden mayor que r formado 
a partir de una matriz de rango r. 

Si D contiene elementos de la ¿-ésima y de la k-ésima columnas 
de la matriz B, también coincide, en virtud de la propiedad 4, 
con el menor correspondiente de la matriz A y, por consiguiente, 
es igual a O. 

Finalmente, si el determinante D contiene elementos de la 
¡-ésima columna de la matriz B, pero no contiene elementos de su 
krésima columna, resulta, en virtud de la propiedad 4, que este 
determinante puede ser representado como la suma de dos deter- 
minantes: D = D,+D», con la particularidad de que uno de ellos 
es igual al correspondiente menor de la matriz A y el otro difiere del 
correspondiente menor de la matriz A en el factor ¿Ec. (El signo 
menos aparece aquí debido a que la columna con los elementos 
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4:x puede «no estar en su sitio».) Así, por ejemplo, 
a Op+Ccdm 02 

Ay dy+cdu ds|= 

ln da+caa ds 


D 





dm di: Om| [an Cóm a 
=|44 4a da|+|a Cda sj. 
as as ss]  |as Cass as 
Por consiguiente, ambos determinantes D, y Ds son iguales a O y 
D=0. 
Luego, todo menor de orden mayor que r de la matriz B es 
igual a cero y, por lo tanto, 
KB) <r(4). 
Pero la matriz A se obtiene, a su vez, de la matriz 3 mediante 
una transformación elemental del cuarto tipo: para obtener la 
matriz A es necesario agregar a la ¡-ésima columna de la matriz B 


su k-ésima columna multiplicada por —c. Según hemos demostra- 
do, el rango de la matriz en este caso no aumenta, es decir, 


na) =r(B). 
Por consiguiente, 
(4) =1(B). 


Es fácil comprobar que toda matriz puede ser reducida, mediante 
transformaciones elementales, a la forma 


A A 
010 







E 0 
0.0 


000...00. 


donde en la «diagonal principal» aparecen r unidades, mientras que 
todos los demás elementos de la matriz son iguales a cero. Está claro 
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que el rango de esta matriz y, por consiguiente, el rango de la matriz 
inicial son iguales a r. 


Ejemplo 6. Calcúlese, empleando las transformaciones elementales, el rango 
de la matriz 


E LE 
A=|2 0 -1 1 
04 51 


(considerada al principio del parágrafo). 

Solución. Restando de la tercera fila la primera duplicada, dividiendo la 
segunda columna por 2 y restando después de la primera columna la segunda 
triplicada, de la tercera columna la segunda y de la cuarta columna la segunda 
duplicada, obtenemos consecutivamente: 


$e Ll 2 31 12 
dr 20 -1 1f=] 20 -1 1. 
-60 3 -3 -60 3 -3 


01 0 0 
=| 20 -1 1], 
-60 3 -3 


donde el signo »- significa que las matrices que él une se obtienen una de la 
otra mediante transformaciones clementales y tienen, por consiguiente, el 
mismo rango. 


Agregando ahora a la tercera fila la segunda triplicada, dividiendo la pri- 
mera columna por 2, agregándola a la tercera columna, restándola de la cuarta 
columna y, finalmente, cambiando entre sí las dos primeras columnas, obten» 
diremos. 


01 00 0100 1000 
A=|2 0 -11f|1000f.[o 100]. 
00 00 c000 0000 


Encontramos de nuevo que el rango de la matriz A es igual a 2. 





$ 8. Noción de dependencia lineal 
Si indicamos por 
e =(3,2,1,2) e =(2,0,-1,1), es =(0,4,5, 1) 


las filas de la matriz A (véase el $ 7), es evidente que tiene lugar Ja 
igualdad 
es = 2e1—3e2, 
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comprendida en el sentido de adición término por término: todo 
elemento de la fila ez es igual al correspondiente elemento de la fila 
es multiplicado por 2 menos el correspondiente elemento de la fila 
es multiplicado por 3: 

En general, siendo €1, €z, ..., €m unas filas de una matriz Á y 
siendo, por ejemplo, 


Em = Meme... Hltm—tém— to (17) 


donde %1, %2, .  », %m-1 $On unos números cualesquiera, diremos que 
la m-ésima fila de esta matriz se expresa linealmente en términos de 
sus primeras m—1 filas o que la fila e es una combinación lineal 
delas filas e1, €, ..., €n-1. De la igualdad (17) se deduce que 


ae bae. H%m—1lm-1€m = 0, 


donde el cero del segundo miembro es comprendido como la fila 
nula (es decir, como la fila formada por n ceros). 

Diremos que unas filas €, ez, ..., €n de una matriz A son 
linealmente dependientes, si se pueden encontrar unos números 
Y» Y2 + «=> Pm, NO todos iguales a cero, tales que 


Yier+yata+. --+Ymém =0. (18) 


Si tales números y, no existen, es decir, si la igualdad (18) tiene 
lugar sólo en el caso en que todos los y; = 0, se dice que las filas 
€1, Ca, +» ., Em SON linealmente independientes. 

Está claro que si una fila de una matriz se expresa linealmente 
en términos de las demás, las filas de esta matriz son linealmente 
dependientes. Recíprocamente, supongamos que entre las filas 
de la matriz Á existe una relación de dependencia lineal (18). Puesto 
que al menos uno de los números ;, por ejemplo, ym, es diferente 
de cero, tenemos 


A o 
a E 
es decir, al menos una de las filas de la matriz se expresa en este 
caso linealmente en términos de las restantes. 

Se puede también introducir un concepto análogo de dependen- 
cia lineal para las columnas de una matriz. 

Teorema 7 (sobre el rango de una matriz). Siendo r el rango de 
una matriz, se puede encontrar en esta matriz r filas (coluianas) 
linéalmente independientes en términos de las cuales se expresan 
linealmente todas las demás filas (columnas). 
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Demostración. Sea dada una [mxn]-matriz de rango r. Supon- 
gamos, para concretar, que el menor de orden r diferente de cero 
de esta matriz aparece en el ángulo superior de la izquierda, es de- 
cir, supongamos que 


4% 





Amt Amz .-- Cmn Ari Ora... rr 


Demostremos que en estas condiciones las primeras r filas de 
esta matriz serán linealmente independientes. (Si es diferente de 
cero no éste sino otro menor de orden r de la matriz A, serán lineal- 
mente independientes precisamente las filas que forman este menor.) 
Supongamos, por el contrario, que estas filas son linealmente de- 
pendientes; entonces, una de ellas —digamos la e, para concre- 
tar— se expresa linealmente en términos de las restantes: 


Er = Je H0erR o. hr 


Restemos de la r-ésima fila de la matriz A la primera fila multi- 
plicada por a, la segunda multiplicada por «a, etc., y, finalmente, 
la (r—1)-ésima multiplicada por a... Después de estas transforma- 
ciones la r-ésima fila de la matriz A quedará compuesta solamente 
de ceros. Además, el determinante D, que en virtud del corolario 
de la propiedad 4 no debe variar, será igual a cero. La contradicción 
obtenida demuestra la independencia lineal de las 7 primeras filas 
de la matriz A. 

Demostremos ahora la segunda parte del teorema, es decir, 
que todas las demás filas de la matriz A se expresan linealmente en 
términos de sus r primeras filas. Sea r <k<my1<!I=<mn;con- 
sideremos el determinante 


Gm a... Gr dy 





Gh Un » Grp Gr 


O Gia. Ue 0 


de orden r-+1 que es igual a cero cualesquiera que sean k y /: si 
1 <= r, por tener dos columnas idénticas, y si / > r, por ser un menor 
de orden r+1 de una matriz de rango r. 
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Desarrollemos el determinante 4 por los elementos de la última 
columna: 


A=aydr+auda+...+0ndr+ardris =0. (19) 


Los complementos algebraicos As, 4», - .-» Ar, Ar+1 delos elemen- 
tos de la última columna dependen de k, pero no dependen de /, 
ya que al calcularlos suprimimos la última columna. Además, 
Ar+1 =D % 0 y, por consiguiente, podemos dividir la igualdad 
(19) por 4,41; así resulta 


E 
donde los coeficientes ay =— Sí no dependen de l. Tomando 
[=1,2,...,n, tendremos 

4 = 0101 +20... Fr, 

Aja = 01412 +04. + 2, 










Ak = 0101042200 > + + Fr 
Pero esto significa que la k-ésima columna de la matriz A se expresa 
linealmente en términos de sus r primeras filas: 

ek = 0101 +0000+ her. 

Corolario 1. El número máximo de columnas linealmente inde- 
pendientes de una matriz es igual al número máximo de filas lineal- 
mente independientes, ya que al trasponer la matriz sus filas se con- 
vierten en columnas y el rango de la matriz no varía. 


Corolario 2. Para que un determinante seaigual a cero es necesario 
y suficiente que sus filas (columnas) sean linealmente dependientes. 


$ 9. Sistemas arbitrarios de ecuaciones lineales 
Consideremos ahora un sistema de m ecuaciones lineales con 
n incógnitas: 
A 
OaiX1rOroXad . . Gan Xa 


Am + max <P Oma ka = Dm, 


donde no se supone que el número de las incógnitas es igual al 
número de las ecuaciones. 







(0) 
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Se llama solución del 'sistema (20) todo conjunto de n valores 
de las incógnitas x, =%1, Xa =%, ..., Xn =%n que al ser intro- 
ducido en las ecuaciones convierte todas éstas en identidades. 
Un sistema que tiene al menos una solución se llama compatible 
y un sistema que no tiene solución alguna se llama incompatible. 
Un sistema que posee una solución úriica se llama determinado y un 
sistema que tiene más de una solución se llama indeterminado. 

Consideremos dos matrices: la matriz A formada por los coe- 
_ficientes de las incógnitas del sistema (20) y la matriz 


e ... Gr bh 
Da 





que se obtiene de A agregando la columna de los términos inde- 
pendientes y que se denomina matriz ampliada. Está claro que 
r(B) => r(4), ya que todo menor de la matriz A es un menor de la 
matriz B pero no viceversa. 

Teorema 8 (criterio de compatibilidad de un sistema de ecuacio- 
nes lineales). Para que el sistema (20) sea compatible es necesario 
y suficiente que el rango de la matriz ampliada B sea igual al rango 
de la matriz de los coeficientes. 

Demostración de la necesidad. Supongamos que el sistema (20) 
es compatible, es decir, que existen unos números x, =%y, Xy = 
= 0h, ++ -, Xn = 0% tales que 


Orbita. - HO = br, 
Gays Haga... hOgatn = ha, 





Amit1hOmata+ Oman = Di 


Restando de la última columna de la matriz B su primera co- 
lJumna multiplicada por «,, su segunda columna multiplicada por 
%a, etc., y, finalmente, su n-ésima colomna multiplicada por dp, 
obtenemos la matriz 

Gm Ga... din 0 

B=|%M % az 0 






Amt mz --- Gm 0 
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cuyo rango, en virtud del teorema sobre las transformaciones 
elementales, es igual al rango de la matriz B: 

r(B;) = rn(B). 

Por otra parte, está claro que r(8,) =r(4), porque todos los 
menores no nulos de la matriz B, son iguales a los correspondientes 
menores de la matriz A y viceversa. Por consiguiente, r(B) = r(4). 

Demostración de la suficiencia. Sea 

1(B) =r(4) =r 
y Supongamos, para concretar, que el determinante diferente de 
cero de orden r de la matriz Á aparece en el ángulo superior de la 
izquierda de la misma: 

Gu da... Gr 

D=|[%m % - lo 





Ar da... Gr 


Las r primeras filas de la matriz B son entonces linealmente in- 
dependientes y puesto que su rango es igual exactamente a r, 
resulta que las restantes filas de la matriz B se expresan linealmente 
en términos de sus r primeras filas, Pero esto significa que las r pri- 
meras ecuaciones del sistema (20) son independientes y que las demás 
m=—r ecuaciones de este sistema son «combinaciones lineales» de 
aquéllas, es decir, son simplemente corolarios de ésas. De hecho 
el sistema contiene en este caso solamente r ecuaciones indepen- 
dientes, Luego, es suficiente resolver las r primeras ecuaciones del 
sistema; sus soluciones satisfacen automáticamente a las restantes 
m—r ecuaciones. 

Ahora pueden darse dos casos. 

L. r = n. El sistema formado por las r primeras ecuaciones del 
sistema (20): 

Arata: aX, = Dr, 








GX +0 aX. Oppx = ba, 


se puede resolver empleando, por ejemplo, las fórmulas de Cramer. 
En este caso el sistema posee una solución única. Luego, es compa- 
tible y determinado. 
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2. r <n. Tomemos las 7 primeras ecuaciones del “sistema y 
dejando en el primer miembro las » primeras incógnitas, pasemos 
las restantes al segundo miembro: 


A A 
OuXih dx + o. + exo bs 





aan» (21) 








nx Oax << hOrX = Dor, 4 1Xr41 Arnk + 
Podemos dar valores cualesquiera a las «incógnitas libres» 
Xr +19 Xr+25 = » =» XnObteniendo del sistema (21) valores correspondien- 
tes para las incógnitas x1, Xa, . . ., Xr. Este es el caso de un sistema 
compatible, pero indeterminado. Las fórmulas generales para la 
solución se pueden obtener resolviendo el sistema (21) respecto a 
X1) X2, + +=» Xy, por medio, por ejemplo, de las fórmulas de Cramer. 
Ahora estamos en condiciones de responder a la pregunta aun 
pendiente: ¿qué puede decirse acerca de un sistema de n ecuaciones 
con n incógnitas cuyo determinante es igual a cero? Para un sistema 
de este tipo el rango de la matriz de los coeficientes * < n, ya que 
el único menor de orden n de esta matriz es, por hipótesis, igual 
a cero. Si el rango de la matriz ampliada B de este sistema es tam- 
bién igual a r, el sistema es compatible, pero indeterminado ya que 
r < n; si el rango de la matriz B es mayor que r, el sistema es incom- 
patible. 
Ejemplo 7. Resuélvanse los siguientes sistemas de ecuaciones; 
LÍ( arder > 2. 2(a+xwtim- x= 0, 
4 atx=- 0 x= xt ata 4, 
ado =-2 xhSxy+S xx, = 4, 
3xy+áxp+dx) = 0. 21:+8x,+727x, = 8, 
3. (x+29 +3 x= 0 
AS 
XrHSx+5x-4x, => 4, 
x+8x9+7x=Tx= 6. 








Solución. 


1, Tenemos r(4) = 3 y r(B) = 3; el sistema es compatible y determidado. 
Puesto que 


1.02 3 
1-1 1l=1440, 
1103-14 


so Cap. 1. Determinantes y sistemas de ecuaciones lineales 





encontramos de las tres ecuaciones primeras del sistema, empleando, por ejem- 
plo, las fórmulas de Cramer, 


2 =-1M=0y%=1 


2. Tenemos r(4) = 2 y r(B) = 2; el sistema es compatible pero indetermi- 
nado. Puesto que el determinante 


li 
de las dos primeras ecuaciones del sistema 
xy+2 = d+ Na, 
a a = 4-2 
obtenemos 





3%0, 





IE E 

Y JA Y 

donde se pueden asignar valores cualesquiera a las incógnitas xo Y Xa- 
3, Tenemos r(4) = 2 y r(B) = 3 y el sistema es incompatible. 

$ 10, Sistemas homogéneos 


Las ecuaciones lineales homogéneas son las ecuaciones en las que 
el segundo miembro es igual a cero: 


+HGrnXn =0, 
+H4anka =0, (22) 


AyXi +Xa+ 
AnyX1 +09X2+ 










AmiX1+ ma Xa + «+ «mn kn = 0. 


Este sistema es siempre compatible ya que posee, por ejemplo» 
la solución mula: 


1=0x=0,...,x1=0 


(es decir, la solución en la que los valores de todas las incógnitas 
son iguales a cero). 

Es importante saber bajo qué condiciones el sistema homogéneo 
(22) tiene soluciones no nulas. La respuesta a este problema viene 
dada por el teorema siguiente. 

Teorema 9. Para que el sistema (22) tenga soluciones no nulas es 
necesario y suficiente que el rango r de la matriz de los coeficientes 
sea menor que n. 
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Efectivamente, siendo r = n, el sistema (22) tiene, como se 
deduce de la demostración del teorema 8, una solución única que 
es, por consiguiente, la nula 

24=0, x2=0,...,x. =0. 


En cambio, siendo r < n, el sistema (22) resulta indeterminado 
(porque no puede ser incompatible) y, por consiguiente, tiene un 
conjuto infinito de soluciones y, en particular, un conjunto infinito 
de soluciones no nulas. 

Del teorema demostrado se deduce directamente este otro. 

Teorema 10, Para queun sistema homogéneo de necuaciones line- 
ales con n incógnitas posee soluciones no nulas es necesario y suficiente 
que su determinante D sea igual a cero. 

Demostración. La condición 

D=0 
es aquí necesaria, ya que siendo D 4 0 el sistema tendrá una solu- 
ción única, es decir, la solución nula. Esta condición es también 
suficiente, ya que siendo D = 0 el rango de la matriz de los coefi- 


cientes del sistema es r < n y el sistema tiene un conjunto infinito 
de soluciones (no nulas). 


Ejemplo 8. Hállese la condición de pertenencia de dos rectas del espacio 
20 _ yb 4 
d mm ” 
As Y 
ma m 
a um mismo plano (cn el sistema rectangular de coordenadas). 

Solución. Supongamos que estas rectas pertenecen a un plano 
Ax+By+CI+D =0, es 


El vector (A, B, C) es entonces ortogonal a este plano y, por consiguiente, es 
ortogonal al vector (9,41 by—b1, c4—c;) que pertenece al plano, es decir, 


Alar a)+Blby—b)+Clc,c) = 0. (4a) 
Además, ambas rectas son ortogonales al vector (4, B, C), es decir, 

Al+Bm,+ Cn = 0, 

Ala+Bma+Chz = 0. en 


Hemos obtenido el sistema (24) y (24b) de tres ecuaciones lineales con tres 
incógnitas A, B y C. Para que tenga soluciones no nulas, es decir, para que 
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exista el plano (23) que contenga las dos rectas dadas, es necesario y suficiente 
que el determinante de este sistema sea igual a cero: 


qa by=by CC 
h m m 
de ma Me 
Esta es precisamento la condición que queríamos obtener. 
Sea 
X= y M2 = a, 000, Ma = O 
una solución no nula del sistema homogéneo (22). Podemos con- 


siderar esta solución como una fila e, = (%, %2, ..., %n) formada 
por n elementos. En este caso la fila 


ces = (0%1, Ca, ..., C%n) 











será, evidentemente, una solución del sistema (22). Además, siendo 
€ = (Bu ba, -..> Ba) 


otra solución cualquiera del sistema (22), la combinación lineal de 
estas soluciones 


creces = (cr + cabr, Crta + Cas, - > +» Cin Can) 


también será una solución del sistema cualesquiera que sean los 
valores de c1 y ca, ya que de 





and +anar +... +ajitn =0, 

anfitanBa+ ...+G1nón =0 
resulta 

anfcia+cob) + arc tc)... 


POC cab») = 0. 


Luego, cualquier combinación lineal de unas soluciones del sistema 
homogéneo (22) será también una solución del mismo. Es interesante 
por esto hallar unas soluciones linealmente independientes del 
sistema (22) en términos de las cuales se expresen linealmente todas 
las demás soluciones de éste. 

Un sistema linealmente independiente ex, €», . : ., ex de solucio- 
nes de las ecuaciones (22) se llama fundamental si toda solución del 
sistema (22) es una combinación lineal de las soluciones €1, 2; .. 
+. E 


2% $ 10. Sistemas homogéneos s3 

Teorema 11 (sobre la existencia de sistemas fondamentales de 
soluciones). Si el rango r de la matriz de los coeficientes del sistema 
de ecuaciones (22) es menor que n, este sistema posee sistemas funda- 
mentales de soluciones. 

Demostración. Supongamos que el rango r de la matriz de los 
coeficientes del sistema (22) es menor que n y aceptemos, para 
concretar, que el menor D que figura en el ángulo superior de la 
izquierda de la matriz A es diferente de cero: 


Gn A... Gn Au 0... My 
,D=[a mm .. rlzo, 





Om Ona .-- Omn Mn Ga... On 


Pasando al segundo miembro de las r primeras ecuaciones del 
sistema (22) las incógnitas libres Xy1, . . ., Xn, ODtenemos el sistema 


AX xa e yy == — 14141 — + + Ora 
Anxi+ ara d ans (25) 








OAXAO Xx e A OprXy == O, pl Xp A 0 + 0 ip > 
Asignando a las incógnitas libres los valores 
Xr41 = 1, Xp42 50, 0, Xa =0, 
obtenemos los valores correspondientes Xx, => %1, X= %2, ... 


x, =0%, de las r primeras incógnitas. Esto nos ofrece una fla 
solución 


(01, 22, +. -+ 0%, 1,0, ..., 0). 
Análogamente, asignando a las incógnitas libres los valores 

Xp41 = 0, Xr42 = 1)... Xp 30, 
y calculando los respectivos valores x, = Bi, X2 = Ba, «.., X= Br 
de las restantes incógnitas, obtenemos la fila 

(Bas Bas ---> Bro 0, 1, «+ 0), 
etc. De esta forma obtendremos un total de k = n-—r-soluciones 
del sistema (25): 

e = (0, %a, --.,%, 1,0, .,., 0), 

€ = (Bm Bas ><» Bn0,1, ..., 0), (26) 


Cn bn . EU S ». 








ex 
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Estas k filas son linealmente independientes, ya que forman una 
matriz 


a to. 
Br Ba. 
ES 
de rango igual exactamente a k. (Esta matriz contiene un menor 
de orden k —por ejemplo, el formado por las últimas k columnas— 
diferente de cero.) 
Demostremos ahora que las soluciones e, e», ..., €x de (26) 
constituyen efectivamente un sistema fundamental. Es suficiente 


demostrar para ello que toda solución del sistema (22) se expresa 
linealmente en términos de €, €2, ... ., €x. Sa, pues, 


e=(0, 02 1 Dr Orga, >>> 00) 
una solución cualquiera del sistema (22). Consideremos la fila 
eo = 00410) —Orgrt2—..  —Dnexo 


Es fácil ver que todos los elementos que figuran en las k últimas 
posiciones de esta fila son iguales a cero, es decir, 


eo = (01, 02) »=<» Or 0,0, --., 0). 


La fila eo es una solución del sistema (22), porque es una combi- 
nación lineal de soluciones. Pero como los valores de todas las 
incógnitas libres en eo son iguales a cero, del sistema (25) —cuyo 
determinante es diferente de cero y que, además, es en este caso 
homogéneo— obtenemos que los valores de las restantes incógnitas 
en eoson también iguales a cero, es decir, que ev es la fila nula: 


lo = ed 101 —Orgot2—..-—Ónex = (0,0, ..., 0), 
de donde resulta que 
ES drsrtrhOractn+ HO 


que es lo que se quería demostrar. 

Observemos que para obtener un sistema fundamental de 
soluciones podemos asignar a las incógnitas libres otros valores 
cualesquiera siempre que el determinante correspondiente de orden 
k sea diferente de cero. De esta forma podemos obtener tantos 
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sistemas Fundamentales de soluciones (cada uno compuesto de 
k = n—r filas) como se quiera. Se puede demostrar que todo sis- 
tema fundamental de soluciones de las ecuaciones (22) está for- 
mado por exactamente n—r elementos (esto se deducirá de los 
resultados del capítulo siguiente). 

Luego, podemos decir que la solución general del sistema (22) de 
ecuaciones lineales homogéneas es de la forma 


ae Hat... +2xex, 
donde es, €2, .. ., ex €s un sistema fundamental cualquiera de solu- 
ciones y %1, %a, . . ., % SON unos números arbitrarios. 
Hagamos una observación más de importancia para lo sucesivo. 
Observación. Consideremos un sistema de ecuaciones 
Axa. FOX = br, 
AmXik xa... 029Xa = Da, (27) 


Ami X1HOmaX2 «+ Uan = Dm 
y su correspondiente sistema de ecuaciones homogéneas 


xx. HA = 0, 
Anxh xa + o «+ O2nXn = 0, (28) 








AmX1i+OmaXo4 o. mk = 0. 

Sea es = (%, as, ...,%.) una solución determinada del sistema 
(27) y sea ea = (fr, Ba, - . ., Ba) otra solución cualquiera del mismo. 
La diferencia 

ee = (Br 22—Ba, ---+ Bn) 
es entonces una solución del sistema (28): de 








Apo + Opa + o... Oigan = bi 
y de 

arfr+ anar... +9 = Di 
resulta 


an —BO+ama—B0+...+0man—Bn) = bib = 0. 
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Recíprocamente, siendo es = (y1, Y2 -»:>» Yn) Una solución 
cualquiera. del sistema homogéneo (28), la fila e+es = (a+ 
%+Ya, - > -y Apr) satisface al sistema (27): de 

ana + ana o. tapan = Di 


y de 

Onyr+anya+ --- + Gila 
resulta 

ano +y)+ anar t+y) +. Hada +7n) =b1+0 = br. 
De aquí se deduce que todas las soluciones del sistema (27) se 
pueden. obtener agregando a una solución cualquiera del mismo 
todas las soluciones posibles del sistema homogéneo (28). En otras 
palabras, la solución general del sistema (27) es igual a la suma de la 
solución general del sistema (28) y de una solución cualquiera, pero 
Hija, del sistema (27). 


0 





$ 11, Método de Gauss 
Las fórmulas de Cramer, de gran interés teórico, no tienen, sin 


embargo, importancia seria en la práctica ya que su aplicación está 
sujeta a cálculos demasiado voluminosos. Para la solución práctica 
de los sistemas de ecuaciones lineales se emplea con mayor fre- 
cuencia el método de Gauss que consiste en la eliminación sucesiva 
de las incógnitas según el esquema siguiente. Para resolver el 


sistema de ecuaciones 
Ayxi+ Oax e «Ora kn = Dr, 
GX Omar + » «Han kn = Da, (29) 





Al ami dh Ona Xt + ++ Gn Xan = Dm 
se escribe la matriz ampliada de este sistema 








da din | dr 
B= a, 
Amr Gra «> Gmn | Dm 


donde la raya separa la cólumna de los términos independientes, 
y después se realizan transformaciones elementales con las filas 
de lá matriz B: se permite cambiar el orden de las filas (lo que 
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equivale a cambiar el orden de las ecuaciones), multiplicar las filas 
por cualesquiera números diferentes de cero (lo que corresponde: 
ala multiplicación de las respectivas ecuaciones por estos números) 
y agregar a cualquier fila de la matriz B cualquier otra fila multi- 
plicada por un número arbitrario (lo que corresponde a la adición 
de una ecuación multiplicada por este número a otra ecuación del 
sistema). Después de estas transformaciones se obtiene toda vez una 
matriz ampliada de un sistema nuevo, equivalente al inicial. Se 
trata de reducir la matriz B a la forma lo más sencilla posible que 
permita indicar directamente la solución del sistema. 

Consideremos más detalladamente el método de Gauss en el 
caso de los sistemas 1, 2 y 3 del ejemplo 7. 


l 
a+2x43x == 2, 
A X+ x= 0, 
30) 
A+Ix— xi =-2, e 
3x4 40+3x = 0. 


La matriz ampliada de este sistema es 


1 2 31 2 
1 -1 1 0 
q 3 -1|-2|' 
3.4 3/0 


Restando la primera fila de la segunda y de la tercera y restando la 
primera fila triplicada de la cuarta, obtenemos la matriz 


1 2 3 2 

0 -3 -2|-2 
0 1 -4|-4|* 

0 -2 -6|-6 

Esta matriz es la matriz ampliada del sistema 

X0+2x43x9 = 2, 
3x9 2x9 =—2, 
xo—4xs , 
—2x2 6x3 =—6, 





Eb 
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que se obtiene del sistema dado (30) al restar la primera ecuación 
de la segunda y de la tercera y al restar la primera ecuación tripli- 
cada de la cuarta. Luego, el sistema (31) es un corolario del sistema 
(30) y toda solución del sistema (30) satisface también al sistema 
(31). Pero, recíprocamente, el sistema (30) se puede obtener del 
sistema (31) mediante transformaciones análogas: agregando la 
primera ecuación a la segunda y a la tercera y sumando la primera 
ecuación triplicada a la cuarta. Luego, el sistema (30) es, a su vez, 
un corolario del sistema (31), es decir, ambos sistemas son eguiva- 
lentes por tener las mismas soluciones. 

Agregando ahora la tercera fila triplicada a la segunda y la 
tercera fila duplicada a la cuarta, obtenemos 


12 3 2 
0.0 -14|-14 
0.1 -4| -ál' 
0.0 -14|-14 


Restando la segunda fila de la cuarta y dividiéndola por —14, 
tendremos 


12 3 2 
00 1 1 
01 -4|-4|' 
00 0/10 


Pero ésta es la matriz ampliada del sistema 
x+20+3x= 2, 
xs L 
xa 4x9 = —4, 
que es equivalente al sistema dado (30); luego, la solución del 
sistema (30) es 
r=1l %=-444%=0 x=2-20-3) =2-3= 


=-L 


En este caso el rango de la matriz ampliada es igual al rango de la 
matriz de los coeficientes y es igual, evidentemente, a tres, 
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24 2x2 + 3x9 xa 
A Xx txt = 4, 
A+ 5x9 + 5x3 4; 
X1+8x2+7x9 7x4 


Escribiendo la matriz ampliada de este sistema, obtenemos, después 
de las transformaciones evidentes: 


4 23 -1 0 l, 2 3 -L (0 
=11 2| 4 0-3-2 3| 4 
. pa 
7 


y 
1 21] 
1 








1 


<a "lo 3 2 <3| 46 

87-118 0.6 4 -6l|-8 
1.2 3 -1|0 
ajo -3 -2 als 
o o o ojol 
o o o ojo 


de donde se deduce que nuestro sistema es equivalente al sistema 
+2 43 x =0, 
( —3x2- 2x4 3x1 = 4, 
y que, por consiguiente, 
4 


2 
e == haa 
8 3 
a dba =P A 


Aquí el rango de la matriz ampliada es igual al rango de la matriz 
de los coeficientes y es igual, evidentemente, a dos. 
3 
X1+2x2+ 3x9 a 
X= Xah Xa+2x4 
443043143 = 
x+80+7x-7x= 6. 






60 Cap. 1. Determinantes y sistemas de ecuaciones lineales 





Tenemos, obviamente, 
1.2 84] 0 1 
Li 1 48 q Ela 
Ls 5 al<ól” 
1 


8 71-— 6 
1 2 3-10 
E. 0-3 -2 3/4 
0 0 o ojo 
o0 0 0 0/14 
es decir, el sistema es incompatible, ya que el sistema que le equi- 
vale contiene la ecuación 
0x1 +0-x2 +0 0x9 00x0 = 14 
(correspondiente a la última fila). Es fácil ver que el rango de la 
matriz de los coeficientes es igual aquí a dos, mientras que el rango 
de la matriz ampliada es igual a tres. 
Ejemplo 9, Resuélvase, empleando el método de Gauss, el sistema homogéneo 
de ecuaciones 
x+2xyt3x9+ dx +5x, = 0, 
2x1+ dx bat Sd xa 0, 
3xp+4x+S xk xa +2x = 0, 
xy Ix ++ 12x,+9x, = 0, 
Ax1+Sxa+6x0— 3x,+3x = 0 
y hállese su sistema fundamental de soluciones. 


Solulcón. Consideremos la matriz ampliada del sistema (la columna nula 
se puede, claro está, omitir). Después de unas transformaciones comprensibles, 
encontramos 


, 





1239 453 LA Y 2 
234 51 0-1-2 -3 -9 
345 12[(2+[0-2-4-1-B|- 
13519 01.2 8.4 
456-33 0-3 -6 -19 -17 
12345 12% 43 
0-1-2 -3-9 01 39 
«fo o 0 -s s5[=fo00-1 1], 
0.000 5-5 0600 00 
0 0 0-10 10 000.00 
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€s decir, el sistema dado equivale al siguiente: 
kh 2H dx td tx =0, 
Xo+2x9 +3 +9x, = 0, 
— x+ x=0. 
Aquí r = 3 y tres de las incógnitas se pueden expresar mediante las restantes, 


por ejemplo, así 
e 
Xy = 209 dx,-9x, = —2x9=12xp, 
x= Lea dx xx) = x9+15%y: 


Un sistema fundamental se puede obtener dando a las incógnitas libres 
Xy y Xg los valores xy == 1, xy = O(en este caso x, == 1, 17 = —=2, xq == 0) y los 
valores xy = 0, x = 1 (en este caso xy => 15, x2 > —12, x, = 1). Así obte- 
nemos el sistema fundamental de soluciones: 


e =(1, -2,1,0,0), 

es = (15, -12,0, 1, D. 
La solución general del sistema es de la forma. 

em cre +cjes = (0141509, —201 1265, €1, C4, 0), 
donde cy y cy son unos números arbitrarios. 








CAPÍTULO Il 


ESPACIO DE n DIMENSIONES 


$ 1. Definición de un espacio vectorial 


Comenzaremos con un ejemplo bien conocido por el lector. 
El concepto de vector, o de segmento orientado, desempeña un 
papel importante en la Geometría. Los vectores pueden ser 
sumados entre sí y multiplicados por números. La suma OC de los 
vectores DA y OB es, por definición, la diagonal del paralelogramo 
OACB (fig. 1, a; esta definición se puede extender también al caso 
en el que las rectas OA y OB coinciden) y el producto OD del vector 
OA por un número a se define por las condiciones: OD = |«]-0A 
y los vectores OD y OA están orientados en una misma dirección, 
sia > 0, y en direcciones opuestas sia < 0 (fig. 1, b). 

Pero el conjunto de todos los vectores planos o el conjunto de 
todos los vectores espaciales representan solamente unos ejemplos 
(aunque muy importantes) de espacios vectoriales. 

En el capítulo 1 hemos visto que siendo 


e =(0,%0, 29) y e =(B 8 +» 80) 


id 0D=a DA 
= A AOL nina 
B 0C=0B-0, $ ÓDLa'04 





Fig. 1 
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dos soluciones de un sistema de ecuaciones lineales homogéneas, 
la suma de estas soluciones 


ee =(0+B, da +Ba, -.., Art Br) 


y el producto de cualquiera de ellas, digamos de e, por un núme- 
ro arbitrario e 


Ce1 == (0%, Cota, .... 0%) 


también serán soluciones de este mismo sistema. Frecuentemente 
nos encontramos en las Matemáticas con situaciones análogas cuan- 
do se tiene un conjunto de élerentos que pueden ser sumados entre 
sí y multiplicados por números obteniéndose de esta forma elementos 
del mismo conjunto. Por ejemplo, los polinomios en f de coeficientes 
reales pueden ser sumados entre sí y multiplicados por números sea- 
les obteniéndose polinomios del mismo tipo. Si el grado de los 
polinomios que se suman y se multiplican por números no sobre- 
pasa un número dado n, los polinomios que se obtienen serán también 
en este caso de grado no mayor que n. Las funciones arbitrarias 
de 1 se pueden sumar entre sí y multiplicar por números resultando 
de nuevo funciones de +. Si las funciones a las que se aplican estas 
operaciones son continuas en un segmento [a, b] (o en toda la recta 
numérica), las funciones que resultan tendrán la misma propiedad. 

Finalmente, los propios números se pueden, por supuesto, sumar 
entre sí y multiplicar por números; es más, en lugar de un número 
se puede considerar pares, ternas y, en general, colecciones ordena- 
das (filas) formadas por n números: 


(ir Ma, +0 <> X1) 
(si antes estas filas aparecían como soluciones de un sistema dado 
de ecuaciones líneales, ahora nada se exige de ellas). Las filas se 
pueden sumar entre sí: 

CA SS 


= (ad Ys X2+ Ye, ty) 





y multiplicar por números: 
Cl%1 Ms +0 01 Xan) = (0X1, CXa, ---> CXp) 
obteniéndose toda vez una fila del mismo tipo. 


Todas estas situaciones son distintos ejemplos de espacios vecto- 
riales (siendo el último ejemplo de importancia primordial para lo 
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sucesivo). Con el fin de abarcar estos y todos los demás casos 
posibles, introduciremos la definición siguiente. 

Definición 1. Un conjunto R de elementos x, y, z, ... se llama 
espacio vectorial. o espacio lineal, sí para cualesquiera dos elementos 
x e y del mismo está definida la suma x-+y € RY y si para todo ele- 
mento x € R y todo múmero real a está definido el producto ex € R de 
modo que se cumplen las siguientes condiciones : 

1. x+y = y-+x para todos los x, y € R. 

2. (x+y) +2 =x+(y+2) para todos los x, y, ER. 

3. Existe un elemento O € R (elemento nulo) 1al que x+0=x 
para todos los elementos x € R. 

4. Para todo elemento x€ R existe un elemento —x (llamado 
opuesto de x) tal que x+(—x) = 0. 

S.lx=x 

6. oBx) = («BJ 

7, (0+B)x =0x4Bx. 

8. 0(x+)) =0x+a0p. 

Los elementos de un espacio vectorial se llaman vectores. 


Ejemplos. Podemos hablar del espacio vectorial P, de los poli- 
nomios de grado no mayor que n con coeficientes reales, o del 
espacio vectorial C de las funciones continuas en un segmento dado 
[a, b], o del espacio vectorial de las soluciones de un sistema dado 
de ecuaciones lineales homogéneas, o, finalmente, del espacio vec- 
torial de filas formadas por n elementos. 

El espacio R suele llamarse espacio real (lineal o vectorial), ya 
que en R está definida la multiplicación de sus elementos por los 
números reales. Si los elementos de R se pueden multiplicar por los 
números complejos, se obtiene un espacio vectorial complejo, Como 
ejemplo de este espacio puede servir el conjunto de todas las filas 
formadas por n números complejos o el conjunto de todos Jos 





1 Los símbolos €, E, E se denominan simbolos de inclusión. La nota- 
ción ac significa que a es un elemento del conjunto A. La notación AC B 
significa que el conjunto A es una parte del conjunto B (es decir, que todo 
elemento a de A pertenece, también a B); la notación ACB significa que el 
«conjunto A es una parte regular del conjunto B, es decir, que A está contenido 
en B pero no coincide con él. 

* Para no confundir los vectores con los números convendremos en 
indicar —en todos los casos que puedan ofrecer dudas— los números por 
letras griegas y los vectores por letras latinas. 
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poliriomios de coeficientes complejos (con más detalle se trata este 
tema en el $ 5 del capítulo V). 

Gracias a la condición 2 podemos hablar de la suma de x-+-y+ 
+2 = (x+y)+2(6 x+(y-+2) que viene aser lo mismo) de tres.o de 
un número mayor de elementos de R. 

Se llama diferencia x—y de los vectores:x e y un vector z tal que 
y = y +2. Es fácil ver que x—p =x-+(—p). 

Efectivamente, 


ARA = ADA) = AD = 
= [yy lex =04x > x. 

Además, de la definición 1 se deducen directamente las propo- 
siciones siguientes. 

1, Unicidad del elemento nulo. Supongamos que en el espacio R 
existen dos elementos nulos 0, y Os. Puesto que para cualquier x 
de R se tiene x+-0, = x y x+-02 = x, resulta, en particular, que 
02+0, = 02 y que 0,-+02 = 0,, de donde, debido a la igualdad 
01-+02 = 04+01, se obtiene 

0; = 0%. 


2, Unicidad del elemento opuesto. Supongamos que un elemento 
x tiene dos elementos opuestos y y z; tenemos entonces x+» «= 0 
y x+z = 0, Por consiguiente, 

YHx+z =y+(x42) =y+0 = y 
e 

YAXHZ = (+) Hz = 042 =2, 
de donde resulta 

y=z. 

3. Para todo elemento x € R se tiene Ox =0", En efecto, tene- 
mos Ox =(040)x =0x+0x cualquiera que sea x. Agregando 


—0x al primer y al segundo miembro de la última igualdad, obte- 
nemos 


0 =0x. 


» El mismo simbolo O se emplea aquí para indicar un número (en el 
Primer miembro) y un vector (en el segundo miembro). Tanto aquí como en lo 
sucesivo, siempre estará claro del propio contexto que es lo que representa el 
símbolo 0, el número cero o el vector nulo, 


4:30 
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4. Para cualquier número real a y para 0 € R se tiene 40 = 0. 
Efectivamente, 0 =x(0+0) =x0+x0. Agregando —20 al primer 
y al segundo miembro de esta igualdad, obtenemos 


0=x0. 

5. Si se tiene «x = 00, resulta que o bien « =0 o bien x = 0. 
En efecto, sea a 54 0; entonces, 

x= lxs (Lajx=h(ax) =70=0 

6. Para todo x el elemento (—1)x es el opuesto de x. Efectiva- 
mente, 

x+(—1)x = 1. +(—1)x > [14(-D)]x =0.x =0 
y, por consiguiente, 

(Dx =—x. 


$2. Dimensión y base 


Definición 2. Los vectores ay, az, . ..., Qs de un espacio lineal R se 
llaman linealmente dependientes si existen unos mÚneros %, %a,. . . 
+ +. ño todos iguales simultáneamente a cero tales que 


aaa. - ax = 0. 


Los vectores que no son linealmente dependientes se llaman 
linealmente independientes. 


Siendo los vectores 41, 42, . . ., Gx linealmente dependientes 
aaa... +00 =0 
y siendo, por ejemplo, az * 0, se tiene 











a= A do 
es decir, 
a Estat. Egaña (1 


donde É; =—2 . Si tiene lugar la igualdad (1) se dice que el vec- 


tor az es una combinación lineal de los vectores 61, 4x, ....., Ami Y 
también que el vector dz se expresa linealmente en términos de 
A, da, . ...O4 1. Luego, siendo los vectores ar, 4s, . .... ar linealmente 
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Fig. 2 


dependientes, al menos uno de ellos se expresa linealmente en tér- 
minos de los restantes. Está claro que la recíproca es también 
válida, es decir, si uno de los vectores se expresa linealmente en 
términos de los demás, estos vectores son linealmente dependientes 
en su conjunto. 

Ejemplos. En el plano existen tantos pares de vectores lineal- 
mente independientes como se quiera : cualesquiera dos vectores no 
colineales, es decir, no paralelos a una misma recta, son linealmente 
independientes. Pero cualesquiera tres vectores del plano son linea)- 
mente dependientes. 

En el espacio cualesquiera tres vectores no coplanares (es decir, 
no paralelos a un mismo plano) a, b y c son linealmente indepen- 
dientes (ya que siendo «a+f$b+yc ="0 y siendo, por ejemplo, 
y 20, resulta e = tal b, es decir, el vector c es coplanar 
con los vectores a y b). Sin embargo, cualesquiera cuatro vectores 
a, b, c y d del espacio serán linealmente dependientes. En efecto, 
sean a=0A, b=0B y c=0C unos vectores no coplanares 
y sea d = OD otro vector cualquiera; trazando la recta DD, || OC 
(8ig. 2;cl punto D, pertenece al plano 40B) y descomponiendo el 


vector OD,, que es coplanar con a y b, respecto a estos vectores, 
obtenemos evidentemente: 


OD; =2a+Bb, 
OD =0D,+D,D 








y 
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y 
DD =yc, 
es decir, 
d =«a+Pb+yc, 


de donde resulta 
d-aa—fb-yc =0. 


(Silos vectores a, b y e son coplanares, existen unos números a, $ y 
y no todos iguales simultáneamente a cero tales que 


aa+Bb+ye =0; 
pero se tiene entonces 
aa+fb4yc+0.d=0 


y los cuatro vectores son también linealmente dependientes.) 

Definición 3. Un espacio lineal R.se llama n-dimensional si. en él 
se pueden encontrar n vectores linealmente independientes pero es 
imposible encontrar más de n vectores linealmente independientes. 

Es decir, la dimensión de un espacio es el número máximo de 
vectores linealmente independientes que éste contiene. Convendre- 
mos en indicar por d(R) la dimensión del espacio R. 

La dimensión del conjunto de todos los vectores planos es igual 
a dos y la dimensión del conjunto de los vectores espaciales es igual 
a tres. 

Los espacios que tienen dimensión finita se llaman espacios de 
dimensión finita. Un espacio en el que se puedan encontrar tantos 
vectores linealmente independientes como se quiera se lama espacio 
de dimensión infinita. Es un ejemplo de un espacio de dimensión 
infinita el conjunto P de todos los polinomios en í de coeficientes 
reales o el conjunto C de todas las funciones de 1 continuas en un 
segmento dado [a, b] (o continuas en tóda la recta numérica). 

Definición 4. Toda colección de n vectores linealmente indepen- 
dientes de un espacio n-dimensional R se llama base de este espacio: 

Teorema 1. Todo vector x de un espacio lineal n-dimensional R se 
puede representar como una combinación lineal de los vectores de la 
base y, además, esta representación es única. 

Demostración. Sea e, es, ..., en una base cualquiera de un 
espacio m-dimensional R y sea x € R. Puesto que cualesquiera 
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n+1 vectores del espacio R (¡de »: dimensiones!) son- linealmente 
dependientes, resultan también dependientes, en particular, los 
vectores €y, €2, . . ., € X, €s decir, existen unos NÚMEeros %1, %a, ... 
+ + «3%, e no todos iguales simultáneamente a cero tales que 

ae ae. pare ax = 0, 


Además, esa > 0, ya que de lo contrario sería diferente de cero uno 
de los números %;, %2, » : .,%n Y, por consiguiente, los vectores e, 
€a, : . ., €, Tesultarían linealmente dependientes. Luego, 


CA La 


=—20-2Za-.. Ze. 


Tomando —2 = xy, tendremos 


A 


Esta representación de x mediante e, €», . ..., €, es ímica, ya que 
siendo x =X101-+Xaeg4 + Xalp Y X= prer + pata... + Prem SO 
tiene 

(1 —x1) e + (2x2) €2+ - . «+ (009) €n =0 


y, debido a la independencia lineal de los vectores €, es, ..., €n, 
resulta 

YE Xp Ja == Más cs Y o 

Los números Xy, Xz, . . ., Xn Se llaman coordenadas del vector x 
en la base e;, €2, .. ., €. Por lo tanto, el teorema 1 afirma que dada 
una base de un espacio vectorial n-dimensional R, todo vector de R 
tiene coordenadas en esta base (determinadas univocamente). 


Además, queda claro que si coinciden las coordenadas de dos vecto- 
Tes x.e y, estos vectores son iguales, ya que en este caso 


X= X1e1+M002+ EX ln = Y. 


Por esto, para determinar un vector basta indicar sus coordenadas 
Xao Xas >» > Xn y Se dice: Vector x = (Xi, Xa, --) Xp) 

Supongamos que se tienen dos vectores dados mediante sus 
coordenadas en una base. Entonces, al sumar estos vectores se suman 
sus coordenadas respectivas: si 

x= xebxe do. hxpén € Y =prtr+yaert PH Yneno 
se tiene 

y (0499) + (042) e2+. - + (XH a) En 
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Al multiplicar un vector por un número todas sus coordenadas se 
multiplican por este múmero: si 


x= X1e1+ Me... + Xntn, 
se tiene 
ax = (0x1) e + (0x2) e2+ . . + (0Xp) €n- 


Todas las coordenadas del vector nulo son iguales a cero, ya que, 
debido a la independencia lineal de los vectores es, €, . . ., £n, de la 
igualdad «jes +oges +... HL 2n =0 resulta que todos los «; = 0, 
El vector opuesto del vector x= (X1, X2, ..., Xn) €s igual a 
(Xt) M2, + >> —Xn), pues 


Qi Ma, 00 Mo) FX) Ms 00: — Xp) = (0,0, ..., 0) =0, 


Teorema 2. Si e,, es, ..., €, son unos vectores linealmente in- 
dependientes del espacio R y si todo vector x € R se expresa lineal- 
mente en términos de €, €2, ..., €n, estos vectores constituyen una 
base de R. 

Demostración. Los vectores es, €», ..., €n Son, por hipótesis, 
linealmente independientes. Resta demostrar que en el espacio R 
no hay más de n vectores linealmente independientes. Tomemos 
cualesquiera m > n vectores 41, dr, . . ., Gm de R. Cada uno de ellos 
se puede, por hipótesis, expresar linealmente en términos de 
Ex Ed 02. En 


41 = anerbames+...+omen, 
Ag = 614 Amor prat 


Am = Ajmth%amtat + HA nmén» 








Consideremos la matriz 


Cu A ..- im 





A a 


Como quiera que el número de filas de esta matriz es igual a m, 
su rango es no mayor que » y, por consiguiente, entre sus columnas 
no hay más de » linealmente independientes. Pero por ser m > n, 
las m'columnas de esta matriz son linealmente dependientes. Esto 
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significa que los vectores 4, 22, ..., Gm Son también linealmente 
dependientes. Hemos demostrado que el espacio Res n-dimensional 
y que es, €2, - .., €, es una de sus bases. 

Del teorema 2 se desprende que el espacio R” de las filas orde- 
nadas formada por n números es.n-dimensional. Efectivamente, 
las n filas 


a=(1,0, ....0, 





son linealmente independientes, ya que de Ja igualdad 
eo... Hanen = (21,0%, --.,%m) =(0,0, ...,0) 


=4, =0. Por otra parte, toda fila 
£,) se expresa linealmente en términos de ex, 






em brertbrer+.+HEntn- 
Las filas es, ez, ..., en forman, por consiguiente, una base del 
espacio R”. 

El espacio P, de los polinomios de grado no mayor que n es 
de dimensión n-+1. En efecto, los polinomios 

A 
son linealmente independientes y todo polinomio en t de grado no 
mayor que 1 se expresa en términos de éstos de un modo evidente. 

"Teorema 3. En un espacio lineal de dimensión finita todo conjunto 
de vectores linealmente independientes puede ser incluido en una base. 

Demostración. Sean e, €2, ..., e. unos vectores linealmente 
independientes de un espacio R. Si todos los restantes vectores de R 
se expresan linealmente en términos de los véctores €, €a, ...., €k, 
estos últimos ya constituyen una base en virtud del teorema 2. Si 
existe un vector ex,1 que no se expresa linealmente en términos de 
€1 er, ». ., €x, 105 + 1 vectores, €, . . .s € €x41 Serán linealmente 
independientes. Efectivamente, si tiene lugar la igualdad 


oem. paebaers =0 


debe ser « 0 —debido a la independencia lineal de los vectores 
61, €2, «+=» 8 Y, por consiguiente, el vector ez ,1 se expresa lineal- 
mente en términos de €,, €2, ..., €. 
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Agreguemos el vector ex, a los vectores €, €2, . . ., €x. Si todos 
los vectores del espacio .R se expresan linealmente en términos de 
€ €2, ---, €, €x41, Estos últimos ya constituyen una base. Si existe 
un vector ex+s que no se expresa linealmente en términos de €1, 
€2, »--,€x, €g+1 lo agregaremos a éstos; el sistema nuevo de vecto- 
TES Cy, €2, -.., Ex, Cg+1, Cx+2Será linealmente independiente, etc. 

Este proceso no puede prolongarse indeterminadamente, ya 
que el espacio R es, por hipótesis, de dimensión finita y, por con» 
siguiente, en él no puede haber un conjunto infinito e,, €2, €3, «.. 
de vectores linealmente independientes. Por esto obtendremos, al 
fin y al cabo, un sistema linealmente independiente de vectores 
Ely €a, «+=, Ex, Ch41, >» =, €nen términos del cual se expresarán lineal- 
mente todos los demás vectores de R. Este sistema será, en virtud 
del teorema 2, una base del espacio R que contiene los vectores 
dados €x, €2, ..., Cho 


$ 3. Isomorfismo de espacios lineales 


Sea R un espacio lineal n-dimensional y sea ex, €2, -.., € UNA 
base del mismo. Para todo vector x€ R existe, según el teorema J, 
una representación única 


Xx metxet Xen 


Si ponemos en correspondencia al vector x la fila (X1, X2, «+ ., Xn), 
resulta, por lo visto en el $ 2, que al sumar unos vectores se suman 
las. filas que les corresponden y que al multiplicar wn vector por 
un número se multiplica por este mismo número la fila que le 
corresponde. 

Es decir, partiendo de la definición general de un espacio 
vectorial n-dimensional, hemos llegado a la conclusión de que este 
espacio tiene la misma estructura, en' cierto sentido, que el espacio 
formado por todas las filas de n números. Por consiguiente, todos 
los espacios vectoriales n-dimensionales tienen la misma estructura; 
son, como suele decirse, isomorfos entre sí. El sentido exacto de 
este término viene dado en la definición siguienté. 

Definición 5. Dos espacios vectoriales R y R' se llaman isomorfos 
sí se puede establecer entre sus elementos una correspondencia 
biyectiva tal que siendo x == x' (siendo x correspondiente a x') e 
y ++ Y', donde x, y € Ry X',y E R',se tenga 


Xy o xy 
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UX e ax 


cualquiera que sea « (o, abreviando, (x+yY =x'+y' y (ax) = 
=ax). 

"Tiene Ingar el teorema siguiente. 

Teorema 4. Para que dos espacios vectoriales sean isomorfos es. 
necesario y suficiente que” tengan la misma dimensión. 


Demostración de la suficiencia. Sean dados dos espacios lineales n-dimen= 
sionales R y R'. Escojamos en cada uno de ellos una base 


luly... E.tDRY E, Ej... en R. 


Pongamos en Correspondencia ál vector x, cuyas coordenadas en la base ey, 
€ - ++: 6 $0N Xp «+=» Xy, el vector x' de 'R' que tiene estas mismas coordena- 
dasen la base e), €s, .-.. és. Al sumar unos vectores sus coordenadas correspon- 
dientes se suman y al saultiplicar un vector por un número sus coordenadas se 
multiplican por este mísmo número; por lo tanto, sí 

xr ey ey, 








se tiene 
xy rey 


AX UN 


cualquiera que sea a. 
Luego, R' esisomorfo a R. 


Demostración de la necesidad. Para demostrar que dos espacios lineales 
R y R' de diferentes dimensiones no són isomorfos entre sí, observemos, ante 
todo, que en una correspondencia «isomorfa» entre dos espacios al vector nulo 
de un espacio le corresponde el vector nulo del otro espacio. Efectivamente, 
sea O el vector nulo de R y sea 0' el vector de R' que le corresponde; sea x' un 
vector cualquiera de R' y sea x == x”, donde x€R. Enestas condiciones la suma 


De O 
Pero O+x =x; además, xx” y como la correspondencia entre R y R' es 
biyectiva, resulta que 

A 
es decir, que O es el vector mulo de R'. 


Sicado los espacios Ry X'isomosfos y siendo correspondientes los yecto. 
105 o dí de Ry los vectores da de R', la dependencia linea] 
de los vectores aj, ap » implica la dependencia lincal de los vectores 
e o dí y vicevera. Eleciivamente, supongamos, por ejemplo, que 
AyA1-H- y +40, = 0. Entonces al vector %,dy+%:0g+ . .. 4:58, del espa- 
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cio_R que es igual al vector OER le corresponde en el espacio R' el vector 
050,+250/+. ..+2,2; Y, pOr consiguiente, 

aa t.. +a0 = 0. 

Por lo tanto, el número máximo de vectores linealmente independientes 


que tienen los espacios isomorfos es el mismo y, por consiguiente, las dimen- 
siones de estos espacios son iguales. 


En virtud del teorema 4, la dimensión es la única característica 
de un espacio vectorial de dimensión finita. Todos los espacios vecto- 
riales n-dimensionales son totalmente idénticos en cuanto a su 
estructura algebraica. Podemos decir, por consiguiente, que un 
espacio vectorial n-dimensional es el espacio de todas las filas de n 
números. Por esto un espacio vectorial n-dimensional puede ser 
indicado simplemente por R”: es legal emplear una misma notación 
para todos los espacios vectoriales n-dimensionales porque todos 
los espacios vectoriales n-dimensionales son iguales (isomorfos). 


$ 4. Cambio de base 
Supongamos que en el espacio R” se tienen dos bases 
ptm cola Y liebres 


Convengamos en denominar base antigua a la primera y base 
nueva a la segunda. Todo elemento de la base nueva se puede, de 
acuerdo al teorema 1, expresar linealmente en términos de la base 
antigua 

€ = Ant +aner+...hAntn, 





OEA AE 0) 


eh = asneibdant24 » + FGmnén 


Podemos decir que los vectores básicos nuevos se obtienen de los 
antiguos mediante la matriz 


Gu lia... On 


4=|% 





Ga Gm .-. Gan 


(con la particularidad de que los coeficientes de las descomposicio- 
nes de estos vectores respecto a los vectores de la base antigua for- 
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man las columnas de esta matriz). e 
cambio de la base €, €», . . ., €n por la base ej, €, -. 

El determinante de la matriz A es diferente de cero, E que delo 
contrario sus columnas y, por consiguiente, los Vectores ej, €z, ... 

e, resultarían linealmente dependientes. 
Reciprocamente, si el determinante de la matriz A es diferente 
de cero, sus columnas son linealmente independientes y, por consi- 
guiente, los vectores ef, es, ... ., €, —que se obtienen de los vectores 
básicos €1, €2, +.» €n mediante la matriz A— son linealmente inde- 
pendientes, es decir, forman una base. Luego, es una matriz del 
cambio cualquier matriz cuadrada de orden n con el determinante 
distinto de cero. 

Veamos ahora cómo se relacionan entre sí las coordenadas de 
un mismo vector en las bases antigua y nueva. Sea 


x=XC1+X2+ + Xnln 





y sea al mismo tiempo 
x=xO+xe+. PX 


“Tomando en lugar de ef, €s, ...., e, sus expresiones (2) en términos 
de €1, €2, + « », £n, ODtenemos 


x= (0101 +auer+.. amen) +xane+aner+ o... + amen) + 
A E O 
+aqnxp) + (0x4 ant... + Ganxa) Cat +. (ami + 
+4mX44 hana) ny 
y, debido a que la descomposición del vector x según la base es, 
2, . « ., en es única, de aquí se deduce que 
X= Ox ++. pk, 
= anxi+ a+. 20Xa, 
Xp = AX + 0x4. FOX 


Luego, Jas coordenadas antiguas del vector x se obtienen de sus 
coordenadas nuevas mediante la misma matriz A, pero los coeficien- 
tes de las descomposiciones respectivas forman ahora las filas 
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e € Fig 3 


de esta matriz. Es fácil ver así mismo que, recíprocamente, las 
coordenadas nuevas xj, Xj, ... ., Xx, del vector x se expresan lineal- 
mente en términos de sus coordenadas antiguas x;, X2, ..., Xn+ 


Ejemplo. Sean e, ez los vectores unitarios en la dirección de los 
ejes de un sistema cartesiano rectangular de coordenadas. Hagamos 
girar los ejes de coordenadas en un ángulo q en el sentido contrario 
al del movimiento de las manecillas de un reloj y sean e; y es los 
nuevos vectores básicos: Los ángulos que el vector e; forma con 


Jos vectores e, y es son iguales a p y a 5 , respectivamente 
(68. 3). Por ello las coordenadas de este vector en la base e, es son 
iguales a cos p y acos (p-< = sen p, es decir, e; = cos p-e1+ 
+sen p»e2. Análogamente, los ángulos que el vector ez forma con 
los vectores e, y e. son iguales ato y a q, respectivamente; sus 





coordenadas en la base e,, ez son iguales a cos (+7) = —sen p 
y 2.C08 y y, por consiguiente, es = —sen p+e,-+C0S p-€9. 

Luego, la matriz del cambio Será en este caso la siguiente: 

a ls p —sen ”] 

snp  cosp 

y las expresiones de las coordenadas antiguas a través de las coor= 
denadas nuevas serán 

XL A COS p-x] Sen poxz, 

Ma = SEN PA A COS Po xA. > 
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$ 5. Súbespacios de un espacio lineal 


Definición 6. Se llama subespacio de un espacio vectorial R a 
todo conjunto R; de elementos de éste que forma el mismo un espacio 
vectorial respecto a las operaciones de adición y de multiplicación 
por número introducidas en R. 

Para comprobar que un conjunto-R, de elementos de un espacio 
lineal R es un subespacio de este último es necesario probar que 
cualesquiera que sean dos vectores x e y de Ri la suma x+ y tam- 
bién pertenece a R, y que cualesquiera que sean el vector x de Ri 
y el número real « el producto «x pertenece también a Ry. Demos- 
remos que estas condiciones son al mismo tiempo suficientes. 
Efectivamente, los, axiomas 1 y 2 y los axiomas de 5 a 8 de un 
espacio vectorial, que son válidos en R, se cumplirán, en particu- 
lar, para los elementos de R;. Resta probar que el vector nulo 
pertenece a R y que para todo x de Ri el vector —x también 
pertenece a Ry. Pero, siendo x € R;, tenemos que los productos 
0.x =0 y (-1)x = —x también pertenecen a Ri. 

La dimensión de cualquier subespacio de un espacio vectorial 
no sobrepasa la dimensión del propio espacio, ya que los vectores 
linealmente independientes del subespacio Ri serán también inde» 
pendientes en todo el espacio y, por consiguiente, el número 
máximo de vectores linealmente independientes de un subespacio 
no sobrepasa la dimensión de todo el espacio. 


Ejemplos. En el espacio ordinario de tres dimensiones (com- 
prendido como el conjunto de los vectores que le pertenecen), 
todos los planos y todas las rectas que pasan por el origen de coor- 
denadas serán subespacios. El propio espacio R y el conjunto for- 
mado solamente por el vector nulo son subespacios de cualquier 
espacio R. En el espacio P, de los polinomios de grado no mayor 
que n, son subespacios, por ejemplo, tados los polinomios P¿ con 
k < n(ya que al sumar y al multiplicar por números los polinomios 
de grado no mayor que k obtenemos polinomios de este mismo 
tipo). (Los polinomios cuyo grado es exactamente igual a n no 
forman un subespacio, ya que al sumar estos polinomios se puede 
obtener un polinomio de grado inferior debido a que los coeficien- 
tes principales de estos polinomios pueden simplificarse.) Por otra 
parte, cualquiera de los espacios P, es un subespacio del espacio P 
de todos los polinomios de coeficientes reales y este último es, a su 
vez, un subespacio del espacio.C de las funciones continuas (ya que 
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los polinomios son funciones continuas y al sumarios y multiplicar- 
los por números resultan de nuevo polinomios). 

Consideremos un sistema de ecuaciones lineales homogéneas 
con la matriz de los coeficientes de rango r: 


A +apx +... H01Xp =0, 
6 





AmXi Ama Xa +. FOX a 


y supongamos que en el espacio lineal R” se ha fijado una base 
cualquiera. Considerando toda solución (2, %2, . . ., %n) del sistema. 
(3) como un vector del espacio R”, obtenemos de los resultados del 
$ 10 del capítulo I que el conjunto de todas las soluciones del sistema 
(3) constituye un subespacio lineal k-dimensional (donde k = n—r) 
de R* y que cualquier sistema fundamental de soluciones es una base 
de este subespacio. 

Demostremos que, recíprocamente, todo subespacio de un 
espacio vectorial se determina por un sistema de ecuaciones lineales 
homogéneas. Sea Ri un subespacio k-dimensional de R” y sea 
€, €%, . . ., ej una de sus bases. Complementemos este sistema lineal- 
mente independiente de vectores hasta obtener nna base ej, es, ... 
++05 Cho har» » > »» €% de todo el espacio HR”. Es fácil ver que, siendo 
Xi» Xy, + +=» Xp las coordenadas de un vector x respecto a esta base 
nueva, el subespacio R, se determina por las ecuaciones 


Mba = 0, Key 50, -.., X7 = 0. 
Además, si Xy, X2, . . ., X, Son las coordenadas del yector x respecto 


a la base antigua e, es, €, tienen lugar, por lo visto en el$ 4, 
las igualdades 








Kg = AX baex . .PXno 


Ka xo a» 





Xp = pr XP Marto Pm oro 


donde «;, son unos números; Juego, el subespacio Ri se determina 
en la base es, es, . . ., en por el siguiente sistema de ecuaciones linea- 
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les homogéneas 
atan. han 
AX baxo.  hX 















Oak, 1 Mb k,2 Xa7b > > + Elk, n Ys 


$ 6. Intersección y suma de subespacios 


Definición 7. Sean Ri y Ry dos subespacios de un espacio vecto- 
rial R. Se llama intersección Ra = RiM Ra de estos subespacios al 
conjunto de todos los vectores de R que pertenecen a la vez.a Ri y a 


Es fácil ver que la intersección de dos subespacios Ri y Ra es un 
subespacio (que está contenido en R, y en Ra). 

Definición 8. Si R; y Re son unos subespacios de un espacio 
lineal R, se llama suma Ry =R1+Ra de estos subespacio al con- 
Junto de todos los vectores de tipo u+, donde u € Ri y v€ Ra. 

La suma de dos subespaciós es un subespacio (que posiblemente 
coincide con R). Efectivamente, siendo x, y € Ru y a un número 
cualquiera, tenemos 


x=4u+0 € y) =U2+0, 
donde 11, 42 € R, y %1, U2 E Ra. Pero en este caso 
x4y = (+02) +(01+02), 


donde 1 +19ER1 y t+HMERo, es decir, x+yERs Además, 
ex =0u tan, donde au ER; y at1€ Ro, y, por consiguiente, 
aAxE Re. 

El subespacio Ri (así como el subespacio Re) está contenido en 
Ry, ya que todo elemento x€.Ri puede ser representado en la 
forma x-+0, donde x€ Ri y O€ Ra. 

Teorema 5. Siendo Ri y Ra unos subespacios de un espacio lineal 
R y siendo Ra = RIN Ra y Ri = Rr+Ra, se tiene 


ARYIHARA) = AR) AA (Ro). (4) 
Demostración. Tomemos una base cualquiera 
Em Ea...» Ek 10) 
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del subespacio Rs. Complementemos el conjunto (5) de vectores 
que pertenecen a la vez a R, y a Re hasta obtener una base 


lr ls fer o (6) 
de R; y una base 
EL Em 0. ho Ebhlo <> Ba (Mm 


de Ra (basándonos en el teorema 3). Probemos que los vectores 
Crea 0.1 oferto 039 Bhgdo <> La (8) 


son linealmente independientes. Con esto quedará demostrado, 
según el teorema 2, que constituyen una base de R4, ya que siendo 
z € Ru se tiene z = x-+y, donde x € Rie y € Ray, por consiguien- 
te, x se expresa linealmente en términos de los vettores (6):e y 
se expresa linealmente en términos de-los vectores (7), es decir, el 
vector z se expresa linealmente en términos de los vectores (8). 
Supongamos que los vectores (8) son linealmente dependientes: 








mee Prats AB AR te 


..«PYo8p = 0. 0) 
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queesiguala —(Ye+18kg1 + +. +Ya80), debe pertenecer en este caso 
tanto a R¡como a Ra y, por consiguiente, pertenece a la intersección 
Rs. Luego, debe expresarse linealmente en términos de los vectores 
básicos (5) del subespacio Rs; sea 

a =0Je+Ore3+...+Oxek o 


De aquí resulta, debido a la unicidad de la descomposición del 
vector a respecto a la base del subespacio Ri: 


a=0,1=1,2 ..,ky fia ofia=.. =P = 
de la igualdad (9) se deduce entonces que 
ae oe. POE YB + + YB = 0 
y, como los vectores (7) son linealmente independientes, resulta 
2a1=0,5=1,2, ...,KY Yugr = Prez = -. =74=0, 
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Luego, los vectores (8) constituyen una base del subespacio Ra y, 
por consiguiente, la dimensión de éste es igual al número de estos 
vectores: 


Kk+(p—k)+(q=k) =p+9-k. 


Pero d(Ry) = p, d(Rs) =q y AR) = k. Hemos demostrado que 
la suma de las dimensiones de dos subespacios es igual a la dimensión 
de la suma de estos subespacios más la dimensión de la intersección 
de los mismos. 

Así, o O cae 2 7. Bd epaco, 20 de cuates 
dimensiones pueden tener como intersección el vector nulo; en este caso su 
guna coincido coa todo el oepecio y la ignaldad (9) ee comentes 242 = 0:44, 
Pueden tener como intersección una recta (un subespacio unidimensional); la 
suma es entonces de tres dimensiones y esto corresponde a la igualdad 242 = 
143, Finalmente, R, y Ry pueden coincidir; en este caso la intersección y la 
o Sidimensionals 3 le maldad (0) da 2% 2 < 242 

's subespacios tridimensionales de R* o bien tienen como intersección un 
piano Cn subespacio bidihensional) y entonces 3-+-3 «= 2.+-4, o bien coinciden: 
343 = 343, (No puede haber más.casos, ya que la suma de estos subespacios 
es a lo sumo de cuatro dimensiones.) 

Si R, es un subespacio bidimensional y R, es un subespacio tridimensional 
de Ri, estos subespacios tienen como intersección una recta (2+3 = 1-44) o 
bien KR está contenido en Re (043 =24+3). 


Definición 9. Si un espacio R es la suma de dos subespacios 
suyos Ri y Ra y la intersección Ra de éstos está formada sólo por el 
vector nulo, se dice que Ra es la suma directa de los subespacios Ry 
y Ra y se escribe 

R=RORs. 

Siendo R = R¡9 Ra, es evidente que 

A(R) = d(RY+dA(Ro) 

Teorema 6. Si-R = RO Ra, todo vector de R se representa de 
sn modo único en la forma u+-v, donde u € Ry y v€ Ra. 

Demostración. Según la definición de la suma de subespacios, 
todo vector de R se representa en la forma u-+w, donde u € R, y 


v € Ra. Supongamos que un vector x de R ha sido descompuesto 
en dos sumas de este tipo 


X=414+0] = +02, 
El vector 4; —uz = %z—v1 pertenece entonces simultáneamente a 


Ri y a Ra, es decir, pertenece a Ra y, por consiguiente, es igual a 
cero, de donde resulta que uy = ts y dx = Ya. 
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Asi, el espacio corriente de tres dimensiones .R* es la suma 
directa de cualquier plano (que pasa por el origen de coordenadas) 
y de cualquier recta / que no pertenece a este plano (y que pasa por 
el origen de coordenadas), ya que todo vector DA de R? se puede 
representar como la suma de un vector colineal con / y de un vector 
coplanar con el plano zx (véase la fig. 4, donde 44) |] /), estando, 
además, la intersección»x 1 1 compuesta solamente del vector nulo. 
El espacio R* se descompone también en la suma de dos cuales- 
quiera de sus planos que no coinciden (y que pasan por el origen de 
coordenadas); pero esta suma no será directa. 

Sea R un espacio vectorial cualquiera y sea 4, 42, ..., 44€ R. 
El conjunto de todas las combinaciones lineales 


10) +0oda+ +. And 


de estos vectores es, obviamente, un subespacio de R. Diremos 
que este subespacio está generado por los vectores Gx, Ga; ..., Ak» 
Este subespacio suele llamarse también cápsula lineal de los vectores 
y, Gd) .«.y Ako 


$7. Definición de un espacio afín 


Más de una vez hemos interpretado en las secciones anteriores el 
concepto general de espacio vectorial tomando como ejemplo el 
plano (corriente) o el espacio (Corriente de tres dimensiones). 
Hablando en rigor, estas interpretaciones no son; sin embargo, 
totalmente exactas: el concepto principal de la Geómetria elemental 
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es el punto y todas las imágenes geométricas pueden ser comprendi- 
das como conjuntos de puntos; por otra parte, en la definición de 
un espacio vectorial los puntos no figuran. 

En el curso elemental de la geometría el concepto del vector 
aparece después del:concepto del punto: se llama vector a un par 
ordenado de puntos AB (a un segmento orientado) y después se 
definen las condiciones de igualdad de los vectores y las reglas de 
adición y de multiplicación por número. 

Ahora tendremos que proceder de un modo diferente. Dis- 
poniendo ya de la definición de espacio vectorial, la completaremos 
Introduciendo en la consideración los puntos. El conjunto que así 
resultará (formado por vectores y puntos) —que suele llamarse 
espacio vectorial puntual o espacio afín— tendrá ya más semejanza 
con el espacio que es objeto de estudio en la Geometría elemental, 
aunque no coincidirá todavía por completo con éste. En efecto, el 
propio concepto de espacio «afin» presupone que este espacio esta 
desprovisto de métrica, es decir, de un método de medir las longitu- 
des y los ángulos. Este concepto resultará completamente idéntico 
(por lo menos en los €asos de dos y de tres dimensiones) al espacio 
corriente sólo después de introducir en él la métrica correspondiente 
(véase el capítulo IV). 

Definición 10. Supongamos que se tiene un espacio vectorial R 
(continuaremos indicando sus elementos por letras latinas minúscu- 
las) y, además, un conjunto de elementos que serán llamados puntos 
y que se indicarán por letras latinas mayúsculas, y supongamos que 
a todo par ordenado M, N de puntos se pone en correspondencia uno 
» sólo un vector x de R (aun cuando a diferentes pares de puntos 
puede ponerse en correspondencia un mismo vector); en este caso 
escribiremos MN = x. Supongamos que esta correspondencia entre 
los puntos y los vectores posee las siguientes propiedades: 

1. Para todo punto M y para todo vector x existe un punto N, y 
sólo uno, tal que MN = x. 
2. Para cualesquiera tres puntos M, N y P se tiene 


MN+NP = MP. 


Todos los puntos y todos los vectores en conjunto forman un 


espacio afin. 
Se dice que un espacio afín es n-dimensional si el espacio vecto- 
rial R que le corresponde es dimensional. 
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Es decir, un espacio afín A es-un conjunto de elementos de dos 
géneros: de puntos y de vectores y la relación entre ellos se da 
mediante la operación de construcción de vectores. Un vector 
arbitrario x se puede construir a partir de cualquier punto M 
obteniendo así un punto determinado N y entonces MN = x. El 
punto M se llama origen y el punto N se llama extremo del vector 





1. Si MN = OP, se tiene MO = NP. Esto resulta de la igualdad 
MN+NP = MP = MQ+0P. 

En particular, puesto que 
MN4-NN = MN = MM+MN, 


se tiene MM = NN, es decir, son iguales todos los vectores cuyo ori- 
gen coincide con el extremo. 
2. El vector cuyo origen coincide comel extremo es el v sl nulo, 
porque de la igualdad MN+NN = MN. resulta que N= 
3. El vector NM es el opuesto de MN, ya que ENANA 
= MM =0 y, por consiguiente, NM = —MN. 


$ 8. Introducción de coordenadas en un espacio afín 


En un espacio afín n-dimensional A las coordenadas de los 
puntos se pueden introducir del modo siguiente. Tomemos un 
punto cualquiera O a título del origen de coordenadas. Para todo 
vector x existe entonces, en virtud de la condición 1'de la definición 
10, un punto X, y sólo uno, tal que OX =x. Así quedará establecida 
una correspondencia biyectiva entre todos los puntos y todos los 
vectores de A: al punto X le corresponderá el'vector x = OX que 
tiene por extremo este punto (en el espacio corriente tridimensional 
esto corresponde a la construcción de todos los vectores a partir 
del origen de coordenadas). 

Tomemos después una base cualquiera es, €2, . .., en en el espa- 
cio vectorial R correspondiente a A. Todo vector x de A quedará 
determinado entonces por la fila de sus coordenadas x = (X1, Xa, 
y Xn). Asignaremos estas mismas coordenadas al punto Y que 
corresponde al vector x, escribiendo X(xx, Xg, ... ., Xn): 
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Luego, si escogemos en un espacio afín m-dimensional A un 
sistema de coordenadas (es decir, un punto O como el origen: de 
coordenadas y una base-e,; €2, ...; €, del espacio. vectorial R 
correspondiente a A), resulta que a todo punto de A corresponderá 
univocamente una fla formada por n números que son las coorde- 
nadas de este punto. Todas las coordenadas del punto O son iguales 
a cero, ya que a este punto le corresponde, obviamente, el vector 
nulo 0. 

Siendo X(x1, X2, . . ., Xn) € Y(Y1, Y2, » + -» Ya) dos puntos de un 
espacio afin A, de la igualdad 


OX+XY = OY 
se tiene 
XY = 0Y-OX, 


es decir, las coordenadas del vector XY son iguales a las diferencias 
entre las coordenadas de su extremo y de su origen. 

Se puede demostrar que, igual que en el caso de los espacios 
octal, todos los espacios: afines de una misma dimensión 
tienen, en cierto sentido, una estructura idéntica. 


Sean A y A' dos espacios afines de una misma dimensión n. Tomemos en 
Cada uno de ellos un sistema de coordenadas y pongamos en correspondencia 
a todo punto de A el punto de 4'con las mismas coordenadas y a todo vector 
de A el vector de A” con las mismas coordenadas. Siendo X «+ X”e Y +» Y”, 
donde XX Xp, «0010, YOw Jas => 019) YX, Y E Ay X”, Y € A, tendremos 
entonces que el vector XY => (Yy—Xp, Ya=Xp ==: Ya —X) Corresponderá al 
vector X'Y” € A! (puesto que tienen las misnías coordenadas) con la particulari- 
dad de que esta correspondencia entre losespacios vectoriales R y R' (correspon- 
dientes a A y a 4 será, evidentemente, isomorfa. 

Definición 11. Dos espacios afines A y A” se.llaman isomorfos, sl entre sus 
elementos se puede establecer una correspondencia biyectiva, que a los puntos del 
primer espacio asigna los puntos del segundo y a los vectores del primer espacio 
asigna los vectores del segundo, tal que: 

1. Siendo X == X'e Y =» Y”, se tenga XY —=— X'Y. 

2. La correspondencia que con esto se establece entre los espacios vectoriales 
ac (correspondientes a A y a 4”) sea isomorfa (en el sentido de la defini- 
E 

Heorema 7. Para que dos espacios afines A y A' sean isomorjos es necesario 
y suficiente que coincidan sus dimensiones. 

Hemos demostrado ya que dos espacios afines de una misma dimensión 
son isomorfos. La recíproca es obvia, ya que, siendo isomorfos los espacios 
vectoriales R y R', éstos deben ser, en virtud del teorema 4, de una misma 
dimensión n. Ésta misma dimensión tienen, por definición, los espacios afines 
correspondientes A Y A”. 
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Luego, todos los espacios afines de una misma dimensión son 
idénticos y la dimensión de un espacio afín es la única característica 
del mismo. Por esto podemos indicar en lo sucesivo por 4” todo 
espacio afín n-dimensional. 


$ 9. Cambio de sistema de coordenadas 


Veamos como se transforman las coordenadas de un punto de 
un espacio afín A" al pasar a un sistema nuevo de coordenadas. 

Supongamos primero que varía sólo el origen de coordenadas. 
Supongamos que el origen nuevo ha sido colocado en el punto O” 
cuyas coordenadas en el sistema antiguo son (%;, %2, ..., %n). 

Para todo punto X de A” tenemos 

DO"+0'X = 0X. (10) 
Las coordenadas del vector ÓX = (x1, Xa, . . ., Xy)S0n las coordena- 
das del punto X'en el sistema antiguo de coordenadas; las coordena- 
das del vector OY =(x, x3, .. ., xs) son las coordenadas del punto 
X en el sistema nuevo; las coordenadas del vector DO” son las 
coordenadas del punto O” en el sistema antiguo, es decir, son 
(01, %, » - > %n). De la igualdad (10) obtenemos 

OX =0X-00 
o, pasando a las coordenadas, 

(ds 9) = (pza +++) A) (2 po +++ 20), 
de donde 

x=x-%, i 





62 cit 


es decir, las nuevas coordenadas de un punto se obtienen restando de 
sus coordenadas antiguas las coordenadas del origen nuevo en el 
sistema antiguo de coordenadas. 

Supongamos ahora que el origen de coordenadas no varía, pero 
que en el espacio vectorial R, correspondiente a A, se escoge una 
base nueva con la matriz del cambio 





el, : an 
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es decir, la base antigua formada por los vectores es, eo. 
sustituye por una nueva formada por | los vectores ej, €2, 
donde 


ej = ayer+arer+-.Htpita, 1=1,2,....M. 


Puesto que las coordenadas del punto X' vienen a ser, por 
definición, las coordenadas del vector x= OX, resulta, según 
hemos visto en el $ 4, que las coordenadas antiguas del punto se 
expresan a través de sus coordenadas nuevas por las fórmulas 





X= 0pxi+apx4+...HGiaXs donde ¡=1,2,. 


En el caso general, en el que el origen de coordenadas O se 
traslada al punto O'(21, de, ..., %n) y la base ey, es, ..., €n Se 
sustituye mediante la matriz del cambio (11) por una base nueva, 
las coordenadas antiguas Xi, X2, ..., Xa de un punto arbitrario Y 
y sus coordenadas nuevas Xi, Xj, ...» x, están ligadas por las 
relaciones 


, 





= a ++. Pas, 





$ 10. Variedades lineales 
Sea dado un espacio vectorial R* en el. que se ha escogido una 
Consideremos un sistema (compatible) de ecuaciones lineales, 
en el caso general no homogéneas: 
AX e xn = Ds, 
OnXi+O29Xa+ e > «+ Ga0Xn Ds, (2) 








AmiX Ona xa > > + HUpXn = be 


tal que el rango de la matriz de los coeficientes sea igual a r y sea 
k=n=r. 
Definición 12. El conjunto delos vectores de un espacio R” cuyas 
coordenadas satisfacen el sistema de ecuaciones lineales (12) se 
llama variedad lineal. 
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9) 


b) 





0% Coptancn) 


Según la observación hecha al final del $ 10 del:capítulo 1, la 
solución general x del sistema (12) es igual a la suma de la solución 
general xo del sistema homogéneo correspondiente (es decir, con 
los mismos coeficientes de las incógnitas) 

Gx hagx+..+HO5Xa =0, 


AnXih oax +. Han =00, (13) 








Ami X1 + OnaXa - + On X= 0 


y de una solución a = (4,, a», ..., 4.) cualquiera, pero fija, del 
sistema (12). Luego, la variedad ineal formada por las soluciones del 
sistema (12) se obtiene agregando un mismo vector a a todo vector del 
subespacio formado por las soluciones del sistema homogéneo corres- 
pondiente (13) (véase la fig. Sa, donde los.extremos de los vectores 
que forman la variedad lineal pertenecen a un plano 7. que se 
obtiene trasladando paralelamente el subespacio seg en.el vector a). 
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Demostremos que, recíprocamente, al agregar un mismo vector 
aa todo vector de un subespacio R, se obtiene una variedad linea]. 
Supongamos que el subespacio R, se determina por el sistema (13) 
de ecuaciones lineales homogéneas y sta a = (ai, lo, ..., 0). 
Tomemos 


AA+ da. 
Aa + moda + 










Ami01-+Ompla+ 
y consideremos el sistema de ecuaciones 

Mpx HaXa +. + 010Xa = hr, 

Ai X1 + Oaaxa +. e (14) 











Amt XL + OmaXa + > « «Un Xa bs 


El vector a es una solución de este sistema (en general, no 
homogéneo). Por consiguiente, la variedad lineal que determina el 
sistema (14) coincide con el conjunto R,+a de los vectores dados. 

La variedad lineal (12) se llama k-dimensional si es k-dimensio- 
nal el subespacio (13) que le corresponde. 


$ 11. Planos k-dimensionales en un espacio afín 


Supongamos que en un espacio afín A” se ha tomado un sistema 
de coordenadas. Consideremos de nuevo el sistema de ecuaciones 
(12). 

Definición 13. .£l conjunto de todos los puntos de A" cuyas coorde- 
nadas satisfacen al sistema de ecuaciones (12) se llama plano k-dimen- 
sional; los planos unidimensionales suelen llamarse también rectas 
y los planos (n—1y-dimensionales, hiperplanos. 

tá claro que todo hiperplano (para éstos se tiene r = 1) se 
puede determinar por una sola ecuación lineal 

a+ axe. 09 Xp =D. 

En el espacio de tres dimensiones los hiperplanos son los planos 
corrientes y en el plano corriente, son simplemente las rectas. 


Se puede demostrar que al pasar a un sistema nuevo de coorde- 
nadas en A", los puntos que satisfacen al sistema de ecuaciones (12) 
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satisfarán a un sistema nuevo de ecuaciones lineales cuya matriz de 
los coeficientes es también de rango igual a r. 

Sea z un plano k-dimensional determinado por el sistema de 
ecuaciones (12). El sistema correspondiente (13) de ecuaciones 
lineales homogéneas también determina un plano k-dimensional zo 
que «pasa por el origen de coordenadas». Si construimos todos los 
vectores a partir del origen de coordenadas, los vectores cuyos 
extremos pertenecen a zo forman un subespacio y los vectores cuyos 
extremos pertenecen ax forman una variedad lineal k-dimensional. 
Esta variedad se obtiene agregando un mismo vector a a todos los 
vectores del subespacio o. Podemos decir, por esto, que el plano 
k-dimensional x. se obtiene de xo mediante una translación paralela 
de vector a. Esto nos sirve de base para introducir la definición 
siguiente. 

Definición 14. Dos planos k-dimensionales se dicen paralelos si 
son equivalentes (es decir, tienen las mismas soluciones) los sistemas 
homogéneos correspondientes a los sistemas que determinan estos 
planos. Se dice que un plano k-dimensionalzx, y un plano I-dimensional 
xa son paralelos (siendo 1 > k) six es paralelo a un plano k-dimen- 
sional contenido enzta (en este caso los sistemas que determinan a 7 
y A m2 son tales que el sistema homogéneo correspondiente a «mz 
es un corolario del sistema homogéneo correspondiente a 11). 

Sea de nuevo = un plano k-dimensional determinado por el 
sistema de ecuaciones (12). En términos vectoriales la solución 
general del sistema (12) toma la forma 


x=0cmc+.. Facta, (15) 
donde 


xo = momo... Poca 


es la solución general del sistema homogéneo correspondiente (13) 
y a es un vector fijo (una de las soluciones del sistema (12). Siendo 
Cr = (Cn, Cm» +.» Cin) para ¡=1,2, ..., k y a = (81, da, ..., 4) 
y expresando la igualdad (15) en coordenadas, obtenemos las 
ecuaciones paramétricas de un plano k-dimensional: 


x =a10y+HwrcH Fa), j=1,2,...,M. 


Si el rango de la matriz de los coeficientes del sistema (12) es igual a 
n—1, hemos convenido en llamar recta al plano (unidimensional) 
correspondiente. En este caso la solución general del sistema (12) 
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es, en forma vectorial, 
x =ac+a, (16) 


donde xy = uc esla solución general del sistema homogéneo co- 
rrespondiente y a = (8, 05, ..., Ga) es un vector fijo (fig. 5, b). 
Siendo € = (Ci, Ca, . +.» Cn) Y X= (%1, X2, -» > Xn) y expresando la 
igualdad (16) en coordenadas, obtenemos las ecuaciones paramétri- 
cas de una recta: 

x=ac+0a, 

Xa =0C9+ 09, 

Xp = UCark An, 
que excluyendo el parámetro « pueden ser reducidas a la forma 

MA _ 7% _ -% 

4 a 

(Estas son las ecuaciones canónicas de una recta. Tienen sentido 
incluso en el caso en que se anulan algunos de los denominadores: 
en este caso también son iguales a cero los numeradores correspon- 
dientes.) A 

Si Alar, 62, . . ., 49) y B(br, ba, . . ., ba) son dos puntos del espacio 
4”, larecía AB que pasa por estos puntos se determina, obviamente, 
por las ecuaciones 


E 
ro ii (mn 


Indicando por £ cada una de las razones iguales de (17), obtenemos 
las ecuaciones paramétricas de la recta AB en la forma 


xi = ar+p(b—aj) 
es decir, 
x=(0-Ba+fb, ¿=1,2,..., 2. 
Tomando 1—$ =«, tendremos 
xy =0«01+8b,, donde a+f8 = 1. (18) 


Si0<au, $ = 1, se dice que el punto correspondiente X pertenece 
al segmento AB. bj 

Si el rango de la matriz de los coeficientes del sistema (12)es igual 
a n—2, el plano que este sistema determina es bidimensional y la 
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solución general de este sistema en forma vectorial es 
x= aycibaaca+ a, 


donde xp = «1C1+x2ca esla solución general del sistema homogéneo 
correspondiente y a =(6r, az, ..., 61) es un vector fijo: Siendo 
€1 = (Ca, Cia »-.y Cin), d cl 2, coordenadas de los puntos 
X= (X1, Mz, «-.» Xn) de este plano se determinan por las fórmulas 


Xx =010 Hoc tar, k=1,2,...,n 


(que representan las ecuaciones paramétricas de un plano bidimen- 
sional). 

Supongamos que en el espacio afin 4” se han tomado dos pla- 
nos; el plano k-dimensional x determinado por el sistema de ecua- 
ciones (12) y el plano /-dimensional x'' determinado por el sistema 
de ecuaciones 


CuXi+Cxad o. . «ECtaXa == 
CuX1+Cexa+ -kouña 


CnXE cx Ro EC 4. 


La intersección de estos planos (es decir, el conjunto de los puntos 
que pertenecen a la'vez a xx y ax”) quedará determinada entonces 
porel sistema formado de todas las ecuaciones del sistema (12) y de 
todas las ecuaciones del sistema (19) y, por consiguiente, también 
será, en general, un plano (que, en particular, puede estar formado 
por un punto sólo e incluso puede no contener ningún punto, si el 
sistema unido resulta incompatible). Es fácil ver que todo, plano 
kedimensional es la intersección de r = n—k hiperplanos. 











(19) 





$ 12. Conjuntos convexos en un espacio afín 


Definición 15. Un conjunto de puntos de un espacio afín se llama 
convexo si con dos cualesquiera puntos suyos A y B contiene también 
todos los puntos del segmento AB. 

Es fácil ver que la intersección de cualquier número de conjuntos 
convexos es un conjunto convexo: 

Definición 16. Un conjunto de puntos. de un espacio afín se llama 
acotado si son acotadas las coordenadas de todos sús. puntos en un 
sistema de coordenadas (es fácil ver que éstas serán entonces acota- 
das en todos los sistemas de coordenadas). 
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Sea dado en un espacio afín A” un hiperplano 

ajXi+02xa+ +. «+ OpXa =b, (0) 
Este hiperplano divide todos los puntos de A”en dos semiespacios: 
As que es el conjunto de todos los puntos para los cuales 
1x1+09X9+ . + +pxn > b y Az que es el conjunto de los puntos 
para los cuales 41X1+42X2+ . « » +4nXn == b. La intersección de los 
semiespacios A, y As es el propio hiperplano (20). 

Teorema 8..Todo semiespacio de tn espacio afín A" es un conjunto 
convexo. 


Demostración. Scan P(pa, Pa, .-» Pr) Y QQ 4» +++ qn) dos 
puntos de 4” pertenecientes, por ejemplo, a A; en este caso 


py+G2park ...+Grpn=> b 


y 
qa. + ara => b. 


Si X(%1, Xo, -. ., Xn) es un punto cualquiera del segmento PO, tene- 
mos según las fórmulas (18) 


x=ap+fqu i=1,2,. 
dondea, $ Oya +8 = 1. Para este punto X tenemos 
ax xt. xn = lap H Ba) + 
+aa(apa+ Pg) +. . + alaprtBqr) =p + aapet + anpr)+ 
+Plaqr+a9a+... +00) > ab+ Bb =(a+8)b =b, 


es decir, un punto arbitrario X del segmento PQ pertenece a Ay. 
El hiperplano (20) es un conjunto convexo por ser la intersección 
de dos conjuntos convexos A; y As. Todo plano k-dimensional de A" 
es convexo porque es la intersección de varios hiperplanos. 
Supongamos que en A” se tienen m semiespacios definidos por 
las desigualdades 


AUX ax e. «ban br, ; 
Omxi+0mXa+. FOX n= Da, 20 


n 









Am XH Oax > + «HO > Dm 
(Todos los signos de desigualdad son aquí del mismo sentido, ya que 
esta situación puede siempre alcanzarse multiplicando, siempre que 
esto sea necesario, ambos miembros de la igualdad por —1.) La 
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Ix+y=9 Msx+y=5 
M2xy=6  IV-x+2y=5 





Fig. 6 


intersección de estos -semiespacios —que es denominada región 
poliedra convexa— determina el conjunto de las soluciones del sistema 
de desigualdades lineales (21). Si esta intersección es acotada se 
lama poliedro (convexo) del espacio n-dimensional A". 

Así, sobre el plano (bidimensional) el sistema de desigualdades 


x+y=<9, 
Sx4+y2> 5, 
2x—y<6, 
2x6 


e> 
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determina un cuadrilatero (convexo) ABCD (fig. 6). El sistema de 
desigualdades 
x+y>9, 
Sx+y= 5, 
2x-y> 6, 
2y-x=6 
(todas Jas desigualdades del sistema (22) han cambiado de signo) 
determina un conjunto vacío de puntos. El sistema de desigualdades 
x+y<9, 
Sx+y 2 5, 
2x—y<=6 
determina la región triangular ABE y el sistema de desigualdades 
x+y<9, 
S5x+y> 5, 
2y-x==6 
determina una región triangular no acotada. 


CAPÍTULO tl 


APLICACIONES LINEALES 


$ 1. Definición y ejemplos 


Definición 1. Se dice que en un espacio lineal R está definida una 
aplicación A si a todo vector x €. R corresponde un vector determi- 
mado ch(x) que generalmente se indicará por otx. Una aplicación 
ol se llama lineal si 


1. A(x+y) = Ax+ Ay, 
2. Aux) =a dx. 


para cualesquiera dos vectores x e y de R y para un número arbitrario 
real a. El vector otx se llama imagen del vector x. 

Tomemos en el espacio R una base €, €2, ..., €m Siendo 
x= xebxet...+pXen y siendo dk una aplicación lineal, 
tenemos 


Ax =xdtet+xaotert...+xnoten 
Pero ote, (donde i =1, 2, ..., 1) es también un vector de R, es 
decir, se puede descomponer ote, respecto a la base €1, €s, -.-> €n 
sea 
Ae = aser +anert ...+Qnién. 
Entonces 
Ax = xi(anes +0ne2+ ..- + anien) + xa(a1201 + 0mer+ +. 
¿0000 +. ext amet «+ nen) (0101 + 9x2 + 
+. Hama + (mxtant..-+amrnjert Hand + 
+40X2+ > > «HOqnXn) En - 


$ 1. Definición y ejemplos sa 





Si xf, xj, ..., xz son las coordenadas del vector (transformado) 
otx en esta misma base ex, €n, . .., €n, €s decir, si 


Ax = xertxieat...+Xems 


tenemos debido a la unicidad de la descomposición de un vector 
según uná base 


MS AH. HO 


(0) 





En una base dada €, €a, ..., €, 2 toda aplicación lineal o£ 
corresponde de esta forma una matriz 


Ln 
aA=|m % an 


du 





ES 


La ¡-ésima columna de la matriz A está formada por Jos coeficien- 
tes de la descomposición del vector Ate, según la base €, €a, -.., €n 
y los coeficientes de las descomposiciones (1) de las coordenadas 
del vector cx respecto a las coordenadas del vector x forman las 
filas de la matriz A. 

Dada una base de un espacio R de n dimensiones, además de 
corresponder toda aplicación lineal ct a una determinada matriz 
A, resulta que, recíprocamente, toda matriz cuadrada A de orden n 
puede ser considerada como la matriz de cierta aplicación lineal. 
Efectivamente, sea e, €», . ..., €, Una base del espacio R y sea dada 
una matriz 


Gan 


Ga Gr... Op 
as Un Uta 










4 Gm 


(escribiremos abreviadamente A = [a;x)). Indiquemos por ct la 
aplicación que transforma un vector cualquiera 


x= Xt HXotad +. hXnén 


Con 


19 
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enel vector 
Ax = xertxet o. bxatas 
donde 


X = Apo tanxe+-...POmXn parai=1,2,..., M. 


Demostremos que esta aplicación es lineal. En efecto, esta apli- 
cación transforma otro vector cualquiera 


y =Yeryat+ Hon 
en 
Ay = Ya + tre. tiens 
donde 
Y = apyi+anYa + + FOiYns 
y por ello el vector 
xy = (a+ yde + (tre. ++) en 
se transforma en el vector 
A lx+y) = me bzetnt..-+znen» 
donde 
2 = 00 +) AAA AIDA Hand) = AH 
Luego, 
Alx+y) = xt Ay. 
Además, cualquiera que sea a se tiene 
ax = (ax) er+(ar) est... +(0%a) €n 


Álax) = ne4he4--+ntn, 
donde 
y = ala) +adax)+ +0 dax») = ax. 
Por consiguiente, 
Alax) =a«ctx, 
es decir, of es una aplicación lineal. 
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Por esto, dada una base en un espacio vectorial R”, a toda aplica- 
ción lineal le corresponde una determinada matriz cuadrada de orden 
n y, reciprocamente, a toda matriz de este tipo le corresponde una 
determinada aplicación lineal. Debido a ello indicaremos con una 
misma letra la aplicación lineal y la matriz que le corresponde 
(en la base dada); así, ot, D, €, .... son unas aplicaciones lineales 
y 4, B, C, ... son las matrices que les corresponden. La matriz 
A se denomina matriz de la aplicación lineal A. 

Es fácil ver que 


A0=0 


cualquiera que sea la aplicación lineal ct. Siendo la aplicación ot 
tal que ofx =0 sólo para x = 0, se dice que esta aplicación es no 
degenerada; en el caso contrario la aplicación ot es degenerada. 

Sea A = [1] la matriz de una aplicación lineal ct. Considere- 
mos el sistema siguiente de ecuaciones lineales homogéneas 


Adan. Oka = 0, 
aX + exa. . En Xn =0, 


AmXhdmaXa d+ + + + onXn = 0. 


Para que exista una solución no nula de este sistema (y, por con- 
siguiente, para que exista un vector no nulo x = x1é1+x9egde .. 
« « +"kXnén tal que céx = 0) es necesario y suficiente, según hemos 
visto en el teorema 10 del capítulo 1, que el determinante de la 
matriz A (que indicaremos por |4|) sea igual a cero. Luego, para 
que una aplicación ck sea no degenerada es necesario y suficiente que 
el determinante de la matriz A de esta aplicación sea diferente de cero 
(¡como quiera que se escoja la base!). Una matriz cuyo determi- 
nante es diferente de cero se llama matriz no degenerada. 

Consideremos algunos ejemplos. 

1. Sea of una rotación de todos los vectores OX del plano xOy 
(o simplemente una rotación del plano x0O») alrededor del origen 
de coordenadas en un ángulo p en dirección opuesta a la de las _ 
saetas de un reloj. Esta aplicación es lineal porque da lo mismo 
sumar primero los vectores a y b y girar después la suma de éstos 
en el ángulo y o girar primero los vectores y sumarlos después 
(fig. 7, a); igualmente da lo mismo multiplicar primero el vector 
a por un número « y giraslo después en el ángulo q o realizar estas 
operaciones en el orden inverso (fig. 7, b). 
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Aa+Ab” A(arb) 





BCA0)=ACga) 
(0) 


Fig. 7 


Supongamos que los vectores básicos son unitarios y recípro- 
camente ortogonales. El vector ote, es un vector unitario que forma 


el ángulo p con es y el ángulo o-5 con es. Por consiguiente, 
ke, =cos p-e1+sen p-e2. 
El vector unitario ctez forma el ángulo 3 +p con es y el ángulo p 
con es. Por consiguiente, 
chez = —sen p-e14008 p-e2. 
Es decir, 
Aia res eng]. 
snp  cosp 
2. Sea cf una rotación del espacio corriente de tres dimensiones 
_ en un ángulo q alrededor del eje Oz. Siendo es, es y es los vectores 


unitarios del sistema cartesiano rectangular de coordenadas, 
tendremos 


ote, = Cos p-e1+sen pres, 
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es decir, la matriz de esta aplicación será 
cosp —seng 0 
áÁ= |snp  cosp o] 
0 0 1 
3. Sea ta la proyección ortogonal del vector a sobre el plano 
xOy en el espacio corriente de tres dimensiones. Esta aplicación 
es lineal debido a que la proyección de una suma de vectores es 
igual a la suma de la proyecciones de los sumandos y a que la. 
proyección del producto de un vector por un número es igual al 
producto de la proyección del vector por este número. Es evidente 
que escogiendo la base igual que en el ejemplo 2 tendremos 


de =e, Ae =e, oe =0 
y, por consiguiente, 


100 
[o 10). 
000 


4. Sea cta el vector simétrico del vector a respecto al plano xOy 
en el espacio corriente de tres dimensiones. Esta aplicación es, 
obviamente, lineal. Además, 


As =e, Ae =e, te =-e 
y la matriz de esta aplicación es 


10.0 
[9 1 0) 
0.0 -1 


5. Tomemos en el espacio P, de los polinomios en £ de grado 
no mayor que n 


AO) =X (0. 


Esta «aplicación de derivación» es lineal según se deduce de las 
reglas principales del cálculo diferencial. Para hallar la matriz de 
esta aplicación tomemos como base, por ejemplo, los vectores 


Á 





e La 
e0=1,4=1, 337, 0. ln =p > 
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Entonces 
Ae =0, Ae =e0, her = 61, ..., Ala =Er1 





010...0 
0.01 o 
42 [900 ... 0 
0D 0 sae; Y 
000..0 


6. Indiquemos por £ la así llamada aplicación idéntica del 
espacio lineal R definida por la igualdad x =x cualquiera que 
sea x€ R. Luego, Ce, =e, paratodoi= 1,2, ..., ny, por consi- 
que la matriz de la aplicación É en cualquier base es de la 
forma 





100 0 
E=|91 0... 0 
9000... 1 


7. Indiquemos por O la así llamada aplicación nula de un 
espacio lineal R definida por la igualdad Ox ="0 para todo x€ R. 
La matriz de esta aplicación está formada solamente por ceros 


00: oia: 0) 





000) su 10 


Está claro que las aplicaciones de los ejemplos 1, 2, 4 y 6 son 
no degeneradas y las aplicaciones de los ejemplos 3, 5 y 7 son 
degeneradas. 

Teorema 1. Una aplicación lineal de un espacio vectorial trans- 
forma todo subespacio en un subespacio. 

Demostración. Sea Ry un subespacio de un espacio vectorial R”. 
Indiquemos por o£R, el conjunto de todos los vectores que son 
imágenes de los vectores de R, en la aplicación lineal cf. Debemos 
demostrar que c£R; es un subespacio. Supongamos que los vecto- 
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rés x € y pertenecen a o£R,. Esto significa que x = Ax ey = Ay”, 
donde "€ Ri € y"€ Ri. Pero en estas condiciones resulta que 
xy =Ax Ay =A(X4y) € ARI, (ya que +yERi) y 
que «x =x«ctx' = ot(ux') € oÉR, (ya que ax' € R;) para todo x. 
Por consiguiente, céR, es un subespacio. 

(Es fácil ver que la dimensión de otR, no sobrepasa la dimen- 
sión de R;). 


Teorema 2. Una aplicación lineal de un espacio vectorial trans- 
forma toda variedad lineal en una variedad lineal. 

Demostración. Sea M una variedad lineal de R”. Existen 
entonces un subespacio R, y un vector a tales que M = Ri+a 
(véase la pág. 88). Si ct es una aplicación lineal, se tiene AM = 

= otR;+cta, El conjunto otR, es, según el teorema 1, un subes-. 
pacio lineal y, por consiguiente, el conjunto ctM es una variedad 
lincal (véase la pág. 89). 

Sea A” un espacio afín de n dimensiones, sea R” su correspon- 
diente espacio vectorial y sea cf una aplicación lineal dada en éste. 
Esta aplicación se puede extender, con el razonamiento que sigue, 
también a los puntos de A”. Supongamos que en A” se ha escogido 
un sistema de coordenadas. Si el vector x = x1€1+ Xaé25 .. - + Xnén 
se transforma cn la aplicación ot en el vector tx = Xje1h xot 
ok... «+ xp8,, Se toma por definición que el punto X(X1, X2, +. ., Xn) 
(que es el extremo del vector OX = x) se transforma en el punto 
X (xd, Xb, « ..» X4) (que es el extremo del vector OX' = Ax). 

Del teorema 2 se deduce directamente que una aplicación lineal 
de un espacio afín transforma los planos k-dimensionales en planos 
(de dimensión no mayor). En particular, las rectas se transforman 
en rectas o en puntos. 


Se; lama. aplicación afín una aplicación biyectiva! del conjunto de puntos de 
un espacio afín »-dimensional sobre sí mismo que transforma toda recta en una 
resta. Delteorema 2resulia que toda aplicación nea o generada de am expacio 
afín es una aplicación afín. Se puede demostrar que toda aplicación afín se 
reduce a una aplicación lineal (no degenerada) seguida, posiblemente, de una 
traslación paralela (véase la pág. 264). 


» Se dice que se tiene una aplicación blyectiva de un conjunto M sobre 
un conjunto N (en particular, de M sobre M) si a todo elemento ac Mso 
pone en correspondencia un determinado elemento 6 € N correspondiendo, 
además, todo elemento 6 € Na un determinado elemento a € M. Se dice 
también en este caso que entre los conjuntos A y B se ha establecido vna 
correspondencia biyectiva (véase las pág. 72 y 85). 
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$2. Operaciones con aplicaciones lineales 


A. Adición de aplicaciones lineales 

Si ct y B son dos aplicaciones lineales de un espacio lineal R, se 
llama suma A+B a una aplicación € tal que 

lx = Ax+Bx 


para todo x € R.Es fácil ver que la suma de unas aplicaciones linea- 
les es también una cación lineal. Si las matrices de las aplica- 
ciones lineales ct y % (en una base determinada) son A = [ay] y 
B = [bx], respectivamente, la matriz de la aplicación € = A-+' 
es C <= [Cy], donde 

Cix = Out Dig 


La matriz C se llama suma de las matrices A y B. Es decir, se toma 
por definición que 

[and + [bx] = [am+bud. 

(Se pueden sumar, naturalmente, sólo matrices de un mismo 
orden.) 

Es evidente que la operación de adición de aplicaciones lineales 
(y de adición de matrices) posee las siguientes propiedades: 

LA+B=B4HA. 

2. (4+B)+8 = A+(B46). 

3. ot+0 =t para toda aplicación A. 

4. Indicando por —cf la aplicación definida por la condición 
(—ot)x = —ctx para todo x€ R, resulta que —ct es una apli- 
cación lineal y que 

(Aj+A =0. 

Indicaremos por — A la matriz de la aplicación —cf; está claro que 
siendo A = [01,] se tiene —4A = [—ay]. 


B. Multiplicación de una aplicación lineal por un número 


Si cf es una aplicación lineal de un espacio R y « es un número, 
se llama producto de A pora a la aplicaciónaH tal que 


(adt)x = a Ax 
para todo vector x€ R. 
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Está claro que «ot es también una aplicación lineal y que su 
matriz «A se obtiene multiplicando por « todos los elementos de la 
matriz A de la aplicación A: 


alan] = [aa]. 


La matriz «4 se denomina producto de la matriz A por el mímero «. 
Es evidente que para la multiplicación de una aplicación lineal 
por un número son válidas las identidades siguientes: 
Ll 1d=d. 
2, (Bat) =(aB) A. 
3. (a+B)ot =act+BA. 
4. a(A+B) =auot+aB. 


Para la multiplicación de una matriz por un número son válidas 
unas identidades análogas. 


C. Multiplicación do aplicaciones lineales 


Se llama producto AB de unas aplicaciones A y B a la aplica- 
ción € tal que 


€x = A (Bx) 


para todo vector x€ R. 

Por consiguiente, la multiplicación de aplicaciones se reduce a la 
realización sucesiva de las mismas, con la particularidad de que 
primero se realiza la aplicación B y después el vector obtenido Bx 
se somete a la aplicación A. 

Por ejemplo, siendo ct una rotación del plano en ángulo y en el 
sentido opuesto al del movimiento de las saetas de un reloj y siendo 
B una rotación en un ángulo y (en el mismo sentido), resulta que 
AB = BA es una rotación de ángulo p+-y. Si ot es la reflexión 
simétrica del plano xOy respecto al eje Ox y B es la reflexión 
simétrica respecto al eje Op, resulta que ct? =8B? =d es la 
aplicación idéntica y que =Ba = 5 esla simetria respecto 
al origen de coordenadas. Si ct es una proyección ortogonal de 
todo el espacio sobre un plano o sobre una recta, tenemos que 
df? = . Si A es la derivación en el espacio de los polinomios, la 
aplicación ot? consiste en tomar la segunda derivada. 

Elproducto de unas aplicaciones lineales es también una aplicación 
lineal. 
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Efectivamente, 
1 (AD) (<+y) = A(Blx+y)) = ABx4By) = 
= AB) 4 A(By) = (AB) x HAB) y. 
2. (AB) (ax) = ADax) = AdBx) = 
=aot(Bx) = (AD) x. 
Veamos cómo se expresa la matriz C de la aplicación lineal 
€ =AL mediante las matrices 4 = [a;x] y B = [bir]. Tenemos 
Oe = A(Bex) = Albuertbues+...+bmtn) = 
= r+boter+.. .+bneoten = 
= bylaye+aner+ ... amen) + 
+balarertamtrt...+anta) +... 
+ FDmMkQ er + Gata. «FGmnen) 
= (Aubix+ ambar... + rmbrx) 14 
+(anbur+ abr... +020br4) Ca +. 
«o "(Qmbrc + anbax + « ++ Gnabnx) En 
es decir, si Ce = cues +emes+. . . +Cnkén, Se tiene 
Cie => anbixambart - «+ Ginbnk « 
Vemos, pues, que para obtener el elemento de la matriz C que 
aparece en el cruce de su i-ésima fila y de su k-ésima columna es pre 
ciso multiplicar cada elemento de la i-ésima fila de la matriz A. por 
el elemento correspondiente de la k-ésima columna de la matriz 


B y sumar todos los productos obtenidos. La matriz C se deno- 
mina producto de las matrices A y B. 


Ejemplos. 


123 Y 4 12 q: e 7 
IB | 1 >][o -1 1]-[-2 2 :] 
32 -l L 2 Mn -1 7 
1-442-04+3-1 1-142-1)4+3-2 
(e oázrara: (-D-1+1(-D422 
3-442.04(-1):1- 3-14+2-D+(-1):2 
1.242+-143.1 
(-D:24+1-142:1 )) 


3.24+2:14(-1):1 
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El producto de estas mismas matrices tomadas en el orden 
contrario es igual a 


+ 47 12m 3 93 2 
[s -1 :] 1 2]-[: 1 3] 
E 21 32 -1 26 6 


Vemos que la operación de multiplicación de matrices es (en 
general) no conmutativa. 
2. pgs —sen y fs cn r]- 
senp  cospJLseny  cosp 
_ [cos p cos y—sen p sen y a E 
sen p COS p+COS p Sen y  —sen p sen y+C0s p cos y 
cos (p+y) —sen (9+y)7 
sen (p-+p) cos (p+p) 
Este segundo ejemplo tiene la siguiente interpretación geométrica: 
la realización sucesiva de dos rotaciones de ángulos y y y de un plano 
equivale a una rotación de ángulo p-++y. 
Consideremos las propiedades de las operaciones de multiplica- 
ción de aplicaciones lineales y de multiplicación de matrices. 
1. Si A, B y € son unas aplicaciones lineales de un espacio R, 
se tiene 
(AB)€ = A(ZO). 
Efectivamente, tenemos para todo vector x€ R 


[(AB)0] x = (AB) (Ex) = ADEx)) 


y 
[ot(BO)] x = ALDO) x] = A(BEx)); 
es decir, la operación de multiplicación de aplicaciones lineales (y, por 
consiguiente, de multiplicación de matrices) cumple la ley asociativa. 
2. Para todo aplicación lineal A se tiene 
tl=td=d. 
La matriz E de la aplicación idéntica € (véase la pág. 102) se 
llama matriz unidad. Para cualquier matriz A (del mismo orden que 
E) se tiene 
AE=EA=A. 
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3. Las operaciones de multiplicación y de adición de aplicaciones 
lineales están ligadas por las leyes distributivas: 
(A+B)0 = AC+BE 
y 
€(A+B) = CA+ 2, 
ya que para todo vector x € R se tiene 
(A+B)0)x =(A+BAOx) = 
= AC 4B(Ox) =(A8) 14 
+H(DO) x = (A04+BE)x 
y 
(Oot4B)) x = O((A+D) x) = 
=Qdx+Bx) = O Ax) +0 Bx) = 
= (0A)x+(0B)x =(04+0B) x. 
En el caso de las matrices tienen lugar unas igualdades análogas. 


Recordemos las leyes fundamentales de adición y de multipli- 
cación de los números. 


Leyes de adición 
1. La adición es conmutativa: 
a4+b=b+a 

cualesquiera que sean los dos números a y b. 
2. La adición es asociativa: 
a+(b+c) = (a+b)+c 

cualesquiera que sean los tres números a, b y c. 
3. Existe un número O tal que 
a+0=a 

para cualquier a. É 
4, Para todo número a existe un número —a tal que 
a+(—a =0. 
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Leyes de multiplicación 


1. La multiplicación es conmutativa: 
ab = ba 
cualesquiera que sean los dos números a y b. 
2. La multiplicación es asociativa: 
abc) = (ab)e 
cualesquiera que sean los tres números a, b y €. 
3. Existe un número 1 tal que 
al=a 


cualquiera que sea a. 
4. Para todo número a Oexiste un número 1/a = a”! tal que 
aqi=l. 


Además tiene lugar Ja ley distributiva que relaciona la adición y 
la multiplicación: 


a(b+c) = ab+ac 


cualesquiera que sean los tres números a, b y €. 

Hemos demostrado que en el caso de la adición y de la multipli- 
cación de aplicaciones lineales y de matrices son válidas todas estas 
leyes excepto la primera y la cuarta leyes de la multiplicación. 
Resulta que la multiplicación de matrices (véase el ejemplo 1) y, 
por consiguiente, también la multiplicación de aplicaciones lineales 
son, en general, operaciones no conmutativas. 

En cuanto a la existencia de la aplicación lineal inversa (de la 
matriz inversa) es válida la proposición siguiente. Para toda aplica- 
ción lineal A no degenerada existe la aplicación lineal A—* (inversa 
de A) tal que 

AAA = Ada E 


(y, respectivamente, para toda matriz A de determinante diferente de 
cero existe la matriz A7* inversa de A tal que AAT* = ATA = E). 

Demostremos esta proposición. Sea dada una aplicación lineal 
no degenerada of con la matriz A en una base determinada es, 
€2, » »»» €n Demostremos primero que existe la matriz inversa de A, 
es decir, la matriz 47? tal que 


AAA SATA E; 
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entonces la aplicación lineal of—1 de matriz A”1 en esta misma base 
1, €2 -., €n será la inversa de ot, ya que la realización sucesiva 
de las aplicaciones ot72 y cf representará la aplicación lineal de 
matriz unidad, es decir, la aplicación idéntica, 

Sea, pues, A una matriz de determinante diferente de cero. 
Consideremos la matriz formada por los complementos algebraicos 
de los elementos correspondientes de la matriz A: 


Au An Asa 
de Am Asa 


a An 


Trasponiéndola obtenemos la matriz A” que se denomina la 
adjunta de la matriz A: 


du 4u ... An 
aa| tn da. 4a 









Ann 









Ara Áon Ann 
Multiplicando las matrices A y A", obtenemos 
(41 0 5 0 
A=e4= | O 
90.0 ... 141 
(según los teoremas 3 y 4 del capitulo 1). Luego, la matriz 
ya 
ask 
4 =79 


será la inyersa de A, 
Ejemplo. Hdllese la motriz inversa de 


LA Ñ 
a 32-]|, 
210 1 


Solución, El determinante de la matriz A es igual a 4. Los complementos 
algebraicos de sus elementos son: Ay =2, Ay = —2, 413 =2, Ay = -2, 
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An =4, A =—2, An = —8, An = 10, Az = —4y, por consiguiente, 


2-2 - 1 y -4 
dr += 4 = ¿a 
2-2 A 1 Ne -2 
Observemos que siendo las aplicaciones Ak y B no degeneradas 
también será no degenerado el producto de las mismas (ya que la 
igualdad (AB) x = A(Bx) = =0 implica Bx =0 y, por con- 
siguiente, x = 0) y que además 
(AB = Badr 
(y en el caso de las matrices (4B)"2 = B7*473), ya que 
(ABBA) = ABBIAN] = 
= ABBA] = ALA = Ad7! = Ll. 
Teorema 3. El determinante del producto de dos matrices es igual 


al producto de los determinantes de los factores: si AB =C, se 
tiene 


1C|=|411B1. 





En estas condiciones, como sabemos, 


cx = abit lnbat «+ Ornbnk = Eon. 
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El determinante de la matriz C es igual a 


$ aybra E tub + Eb 
ye cubra 2 aut y ba 





101 =]|, E, nba 2 Cubs 


TAN 
Po 





E mba E aubra --- E Ou bra 
naa sa ps 
y puede ser representado, según la cuarta propiedad de los determi- 
nantes, en forma de la suma 
Mpbja Guia Ay bio 
abra abia CATON 






maz 2 





Anpbys Arpbja ajja 


«onde los índices j,, ja, . . ., jn recorren independientemente todos 
los valores 1, 2, 3, ...., n (esta suma contiene un total de »” suman- 
dos). Sin embargo, se puede aceptar que en el determinante que 
aparece bajo el signo de la suma todos los Índices jr, Ja, . . ., Jn SON 
diferentes, ya que los determinantes que tienen índices iguales jz 
son iguales a cero por tener columnas proporcionales. Por consi- 
guiente, en esta suma quedan sólo »! sumandos correspondientes a 
diferentes colecciones de ji, a, . . ., jn. Sacando ahora fuera del signo 
del determinante el factor común de los elementos de cada una de 
las columnas, obtenemos 


OY Gif -.- Ga 
[Cl=, E Prabia => Ba ho a) 





Onjy Bnjg 000 Oo, 
donde la suma se efectúa por todas las permutaciones posibles 





bajo el signo de la última suma de manera que los segundos Índices 
de sus elementos aparezcan en el orden de crecimiento. Esto se 
puede realizar mediante un número determinado de trasposiciones 
de columnas. Para pasar de una permutación a otra de la misma 
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paridad se requiere un número par de trasposiciones y para pasar a 
una permutación de paridad opuesta se necesita un número impar 
de trasposiciones; como, además, la permutación 1, 2, ..., mes 
par, resulta que el determinante del secado miembro dela igualdad 
(2) es igual a (—1)U0/a --»:/al | 4]. Tenemos, por consiguiente, 


lO] =) E, Dd rd jad. Opa] 4] =1 41 181. 


Ejemplo. En el ejemplo 1 de la pág. 106hemos multiplicado las matrices 


12 3 4 12 
A=|-111 2 y B=|0 -1 1]. 
32 -1 : AU 0 | 
Tenemos encste caso | A] =—10, |B] =-9 y 14B| =]BA| =90=141-1Bl, 


$ 3. Cambio de base 


Supongamos que una aplicación lineal ct tiene en una base 
€1 €2, +...» €n la matriz A = [ax] y que en la base ej, €, ..., € 
tiene otra matriz A' = [aj;]. Veamos cómo están relacionadas 
entre sí las matrices A y A". 

Indiquemos por C'= = [cu] la matriz del cambio de la base 
€1, €2, - + ., €n por la base ej, €%, . . ., €=. Entonces, 


= Cue +Cnta+.. -HCniéno 


Consideremos la matriz C como la matriz de una aplicación linea! 
€.en la base €1, €2, . . ., €n. Es obvio entonces que 


Lej = cues +ene+...+Cnitn = Ej, 


es decir, la aplicación Se € transforma los vectores e,, ea, . 
en los vectores ej, ez, .... €, Tespectivamente. 

El determinante de la matriz de la aplicación € es diferente de 
E ($4 del ca plo Dy a para € existe la aplica- 
ción inversa tal que = 61, O71ez =62, ..., Ole, = en 
Por hipótesis, 


ote = ae tae... 


Aplicando a ambos miembros de esta igualdad la aplicación €-1, 
obtenemos 


Orea +A. +0 
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Introduciendo en el primer miembro de la última igualdad las 
relaciones e, = Ce, encontramos 

CA le, = ayer +apegt >. +Onens 
es decir, la matriz A' es la matriz de la aplicación €-14€ en la 
base €1, 82, » + +, €n. Pero, por otro lado, la matriz de esta aplicación 
esigual al producto de las matrices de las aplicaciones £=%, of y € 
en la base €, €a, « --, €n €S decir, 

4 =CTIAC. 

De aquí se deduce, en particular, que el determinante de la 
matriz de una aplicación lineal no depende de la base: 

|4'| =|C-14C| =|C-1114]|C| =1C-"11C1141= 

a |C-1C]14| =1E1141=141. 

Ejemplo, Uns.oplicaiónc£tiencen una baso slamatiz 4 = [£ 4 
Determínese la matriz de esta aplicación en la base e, = e, +2e5, e, => 2e7-+30 

Solución. La matriz del cambio es en estecaso C = E gy eee 


-3 
2 -1 


ME EE! 
$ 4. Matrices rectangulares 


Una matriz formada de m filas y de n columnas se denomina 
[mXn]-matriz. Se puede definir la operación de adición de [mXn]- 
matrices tomando 


inversa es CT! = [ 





hai hase Das 
Outón Artbw .. Gurtdin 
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y la operación de multiplicación de una [mx n]-matriz por un número 
a mediante la igualdad 





Gu Mz... Gia a Mara + 25 
$ =|[%%m vam ... vn 
Ami ma >>> Qmn Amr LONE ++ On 


Las matrices rectangulares pueden ser consideradas como las 
matrices de las aplicaciones lineales de un espacio vectorial en otro. 
Supongamos concretamente que se tienen dos espacios lineales 
R” y R”, en general, de distintas dimensiones y que a todo vector 
x € R” se pone en correspondencia un vector ofx € R” de manera 
que se cumplan las condiciones siguientes: 


1, A(x+y) = Ax+ Ay. 

2. ob(ux) =actx. 

Tomemos una base €, €», ..., e, en el espacio R” y una base 
Lu Ja, -..» fm en el espacio R”. El vector ote, pertenece a R” y, 


por consiguiente, puede ser descompuesto porla base fa, fa, ..., fm; 
sea 


Ae =af+amf+...+0mÍm, 
ote = amfitanfat...+0m0 fm, 











Orfeo ft o. kGmnfm. 


Es decir, a la aplicación lineal cé del espacio R” en el espacio R” 
le corresponde la matriz rectangular 


Ay a... Or 





lmk Az <> Amy 


Es fácil ver que las [mX1]-matrices (en particular, las matrices 
cuadradas de orden ») forman un espacio lineal R. Indiquemos por 
en la [mXn]-matriz en la que 4; =1 mientras que todos los 
demás elementos son iguales a cero. Queda claro, entonces, que 
todas estas matrices son linealmente independientes y que cualquier 
[mXn]ematriz es una combinación lineal de aquéllas. Por consi- 
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guiente, la dimensión del espacio R es igual a mn. En particular, 
el espacio formado por todas las matrices cuadradas de orden n 
es de dimensión »?, 

Por analogía con la multiplicación de matrices cuadradas se 
puede definir también la multiplicación de matrices rectangulares. 
Esta multiplicación puede ser realizada sólo en el caso en el que 
la longitud de la fila del primer factor sea igual a la longitud de la 
columna del segundo, es decir, cuando el número de columnas del 
primer factor sea igual al número de filas del segundo. El producto 
de una [mXnj-matriz por una [nXp]-matriz será, evidentemente, 
una [m Xp]-matriz. En particular, el producto de una [mX»]-matriz 
por una [nX 1]-matriz, es decir, por una columna, será una [mX 1]- 
matriz, es decir, una columna, y el producto de una [1 X<m]-matriz, 
es decir, de una fila, por una [mXn]-matriz será una [1 Xm]-matriz, 
es decir, una fila. 


Ejemplos. 


1 20 
27 3 al o E 7 
10 -1 2J|1 12 2 -5 4 
1 3 


3 





12 
3.1 2 af: 3/1 20]. 
314 


Es fácil comprender el sentido de la operación de multiplicación 
de matrices rectangulares. Supongamos que se tienen tres espacios 
lineales R”, R” y Re, en general, de distintas dimensiones y dos 
aplicaciones lineales: la aplicación cf que transforma .R” en RP A 
la aplicación B que transforma R" en R”. La aplicación + 
que pone en correspondencia a todo vector x€ R” un vector 
cs x) del espacio R? se denomina producto de las aplicaciones ct 
y 2. Es fácil ver que c£B es una aplicación lineal de R” en R? y sia 
a aplicación of le corresponde la [pXm]-matriz A y a la aplicación 
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3 le corresponde la [mXn]-matriz B, la matriz de la aplicación 
AB será la [pXn]-matriz AB. 


Es fácil demostrar que para las operaciones de adición y de multiplicación 
de matrices rectangulares se cumplen las relaciones siguientes; 

LA+B > B+A. 

2 (A+HB)+C = AF(B4+C). 

3. A-+0 = 4, donde 0 es la matriz rectangular con todos los elementos 
iguales a cero (la matriz mula). 

4. A+(—4) = 0, donde —A es la matriz en la que todos los elementos 
son los opuestos de los elementos correspondientes de la matriz 4. 

SADO = (ADC. 

5 d+ 

7. C(A+B) = CA+CB, 
siempre que las matrices sean tales que todas estas operaciones puedan ser 
realizadas, Además, siendo A una [mxn]-matriz cualquiera, se tiene 

AEL=4A y Esb=4, 
donde E,, es la matriz unidad de orden n y E,, es la matriz unidad de orden m. 


Si ct es una aplicación lineal de un espacio R, a la igualdad 
otx = y, donde x, y € R, le corresponde en toda base la igualdad 
matricial 


AX=Y, 


donde A es la matriz de la aplicación cf, Xes la columna formada 
por las coordenadas del vector x e Y es Ja columna formada por 
las coordenadas del vector y. 

Consideremos un sistema de ecuaciones lineales 


AUX ax >. «FX = Da, 


[6] 





Om Oma Xi - + + AmnXn = By. 


Indiquemos por A la matriz de los coeficientes de las incógnitas 
de este sistema, por X la columna formada por las incógnitas y por 
B la columna formada por los segundos miembros. El sistema (3) 
puede ser representado entonces en forma de una ecuación matri- 
cial 

AX =B. 

Si la matriz A es cuadrada y su determinante es diferente de 
cero, existe la matriz inversa 471, Multiplicando ambos miembros 
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de la última igualdad por 47 a la izquierda, obtenemos 
ATKAX)= A71B, de donde X= A“IB. 


Desarrollando esta fórmula llegamos a las fórmulas de Cramer 
(compárese con la pág. 39). 


$ 5. Rango y defecto de una aplicación lineal 


Definición 2. Sea ot una aplicación lineal de un espacio R. El 
conjunto D de todos los vectores de forma okx, donde xER, se 
llama dominio de valores de la aplicación AA y el conjunto M de 
todos los vectores x tales que A x =0 se llama núcleo de la aplica- 
ción. 

Demostremos que el dominio de valores y el múcleo de una 
aplicación lineal son subespacios de R. 

Efectivamente, si x, y € D, se tiene x = ctx, e y =ofy1, donde 
X1 Y1 ER, y por esto 

xy = Ax ty = A+), 
donde xi+y1€ R; luego, x+y€ D; además, 

ex =0 0tx, = laxy, 
donde «x, € R, y por consiguiente, « x € D. 

- Por otro lado, si x, y € M, es decir, si tx =0 y oty =0, se 
tiene 

Ax+y) = Ax+ Ay =0 


y 

oax) =% otx =0, 
esdecir, x+y€ M y axE€M. 

La dimensión del dominio de valores de una aplicación A coincide 
con el rango de la matriz A (y se denomina rango de la aplicación 
A). Efectivamente, el subespacio D es generado por los vectores 


Ae; Az, ..., Am (4) 


donde es, €, « - ., en es cualquier base del espacio R, y, por consi- 
guiente, la dimensión de D es igual al número máximo de vectores 
linealmente independientes que contiene el sistema (4), es decir, 
es igual al número máximo de columnas linealmente independien- 
tes de la matriz A (véase la pág. 44). 
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La dimensión del núcleo M se denomina defecto de la aplica- 
ción lineal A. 

Teorema 4. La suma del rango y del defecto de una aplicación 
lineal A es igual a la dimensión n del espacio. 

Demostración. Sea r el rango de la aplicación lineal Af. Entre 
los vectores ote, ote», ...., ote, existen entonces r vectores lincal- 
mente independientes y todos los restantes se expresan linealmente 
en términos de éstos. Sean ote, ctea, ..., ote, estos yectorés. 

Indiquemos por £ el subespacio que generan en R los vectores 
€1 €2 ++», €, y demostremos que la intersección del subespacio L 
(de dimensión r) con el núcleo M consta sólo del vector nulo. Efectiva- 
mente, si x€ LN M, se tiene x € L, es decir, 


x= +04.) 
y x€ M, es decir, 
Ax =a de +acdte+...+oote, =0, 


Pero los vectores ote, otes, ..., ote, son linealmente independien- 
tes; luego, 4, =49=...=%=0yx=0. 

Demostremos ahora que los subespacios L y M generan todo el 
espacio R (es decir, la suma de estos subespacios coincide con .R). 
Sea x un vector cualquiera de R. Entonces fx € D y, por consi- 
guiente, 


Ax= pte+fadert...+B ote. 


El vector y = Bre1 +Baen+ ...-+Be, pertenece, obviamente, a L y 
la diferencia z = x—y € M, ya que 


Az = Ax=y) = ÁAx-aAy =0. 
Hemos encontrado que x = y+z, donde y€ L y 7€ M. 
Es decir, el espacio.R esigual a la suma directa de los subespacios 


L y M y, por consiguiente, su dimensión » es igual a la suma de las 
dimensiones de estos subespacios (véase la pág. 81). 


$ 6. Aplicación lineal no degenerada 


Una aplicación lineal ok se llama no degenerada si de la igualdad 
Ax =0 se deduce que x =0 ($1). Además, hemos demostrado 
($ 2) que el determinante de la matriz de una aplicación lineal no 
degenerada es diferente de cero cualquiera que sea la base y que 
para toda aplicación lineal no degenerada o existe la aplicación 
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lineal inversa ot”. Recíprocamente, si para la aplicación lineal ot 
existe la aplicación inversa ct—1, esta aplicación es no degenerada, 
ya que aplicando a ambos miembros de la igualdad kx = 0 la 
aplicación ct”*, obtenemos 


AYAx) = AT =0, 
pero 
AMUAx) = (AMA) =x 


y, por consiguiente x = 0. 

El rango de una aplicación lineal no degenerada de un espacio 
Rr = Res igual a n, ya que el determinante de su matriz es diferente 
de cero; el defecto de una aplicación lineal no degenerada es igual a 
cero. Recíprocamente, toda aplicación lineal de rango n del espacio 
R será, evidentemente, no degenerada. El dominio de valores de 
una aplicación lineal no degenerada es n-dimensional y, por consi- 
guiente, coincide con todo el R: una aplicación lineal no degene- 
rada transforma R sobre todo el R. El núcleo de una aplicación 
lineal no degenerada consta sólo del vector mulo. Una aplicación 
lineal no degenerada es biyectiva, ya que de la igualdad kx = Ay 
resulta ck(x—») =0 y, por consiguiente, x—y =0, es decir, 
xy 

ÚUna aplicación lineal no degenerada transforma vectores lineal- 
mente independientes en vectores linealmente independientes. Efecti- 
vamente, si los vectores €, €;, . . ., €; Son linealmente independien- 
tes y 


a tertartert... +aote, = 
= Alajer+ores+... Hare) = 0, 
se tiene 
a =0. 





ojeras +. ae =0y a =% + 


Demostremos que siendo ct una aplicación lineal de rango r 
3 una aplicación lineal no degenerada, ambas aplicaciones 
y Bok serán de rango r (y, por consiguiente, el producto de una 
matriz de rango » por una matriz de determinante diferente de cero 
será una matriz de rango 1). 

Efectivamente, el dominio de valores de la aplicación: lineal 
(no degenerada) 3 coincide con todo el espacio y, por consiguien- 
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te, el dominio de valores de la aplicación ctB es r-dimensional, 
es decir, el rango de la aplicación otZ es igual a r. 

Por otra parte, el dominio de valores de la aplicación ok es 
r-dimensional y como la aplicación B, por ser no degenerada, 
transforma vectores linealmente independientes en vectores lineal- 
mente independientes, resulta que el dominio de valores de la 
aplicación Bot es también r-dimensional, es decir, el rango de la 
áplicación Bot esigual a r. 


$7. Subespacios invariantes. Vectores propios y valores 
propios de una aplicación lineal 


Sea R, un subespacio de un espacio lineal R y sea of una aplica- 
ción lineal de R, La imagen otx de un vector x de R; puede no 
pertenecer, en general, a R,. Son de interés especial los subespacios 
cuyos vectores no salen en la aplicación of de estos subespacios. 

Definición 3. Un subespacio Ri de un espacio R se llama invariante 
respecto a una aplicación lineal ct si la imagen Ax de todo vector x 
de Ri pertenece a Ri. 

Ejemplos, 1. Sea ct una rotación del espacio corriente de tres 
dimensiones alrededor del eje Oz. En este caso el plano x0y y el 
eje Oz, por ejemplo, serán subespacios invariantes. 

2. Si ot es la proyección ortogonal del mismo espacio R? 
sobre el plano xOy, los subespacios invariantes son: el plano 
x0y, todos los planos que pasan por el eje Oz, el propio eje Oz y 
todas las rectas del plano xOy que pasan por el origen de coordena- 
das. 

3. En el espacio P, de los polinomios de grado no mayor que n 
los subespacios Pz son invariantes respecto a la derivación para 
todo k,0=k=nm. 

4. En cualquier espacio todo subespacio es invariante respecto a 
las aplicaciones idéntica y nula. 

4. En cualquier espacio y para cualquier aplicación lineal el 
propio espacio R y el subespacio formado sólo por el' vector nulo 
son invariantes. 

Demostremos que la intersección y la suma de subespacios inva- 
riantes respecto a una aplicación lineal <A son invariantes respecto 
ad. 

Efectivamente, si los subespacios R, y Re son invariantes res- 
pecto a of y si xE RIN Ra, resulta que x€ Ri y x€ Re y, por 
consiguiente céx € Ri y otx € Ro, es decir, tx ER,N Ra. 
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Por otra parte, si x € Ri+ Ro, se tiene x = u+v, donde u € Ri 
y vERz. Pero entonces AuERi y otvE Rs y otx = odu+ 
+oto E Ri Ro. 

Tienen un interés particular los subespacios invariantes de 
una dimensión. Si R, es un subespacio de este tipo y x € Ri, también 
ctx € Ri y, por consiguiente, otx = Ax. Siendo y otro vector cual» 
quiera de R;, se tiene y =«x y . 


Ay = Alex) =actx =x(Ax) = Max) = Ay. 


Definición 4. Un vector x + O se llama vector propio de una 
aplicación lineal A, si existe un número 4 tal que Ax = Ax; este 
número ). se denomina valor propio de la aplicación A (de la 
matriz A) correspondiente al vector x. 

Según acabamos de ver, siendo R, un subespacio invariante 
unidimensional de R, todo vector de R, es un vector propio de la 
aplicación «A, además, con el mismo valor propio. Recíproca- 
mente, si x es un vector propio de una aplicación cf, el subespacio 
unidimensional R, que este vector genera (formado por todos los 
vectores de tipo «x) será, obviamente, invarianto respecto a ok. 

Supongamos que una aplicación lineal cf tiene n vectores 
propios linealmente independientes €,, €», . .., €n Con los valores 
propios 41, Aa, »-»» An, respectivamente. Tomemos los vectores 
€1, €%, » »-, €n por básicos; debido a las igualdades 










Ae = her 
Ae: = her, 
An dat 
la matriz de la aplicación of será de la forma 
A Qs Ú 
dio LO e 
0 0... 4 


(toda matriz de este tipo se llama diagonal). Está claro que tiene 
Ingar también la afirmación recíproca: si la matriz A de una aplica- 
ción lineal A es diagonal en una base determinada, todos los vecto- 
res de esta base son vectores propios de la aplicación A. Sin embargo, 
no toda aplicación lineal ni mucho menos de un espacio n-dimen- 
sional posee n vectores propios linealmenté independientes. 
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Teorema 5. Los vectores propios de una aplicación A correspon- 
dientes a valores propios, distintos dos a dos, son linealmente inde- 
pendientes. 

Realizaremos la demostración por inducción según el número 
de vectores propios considerados. Para un vector x esto queda 
claro, ya que, por definición del vector propio, éste es diferente de 
cero o por consiguiente, de la igualdad «x = O resulta « = 0). 

Supongamos que nuestra afirmación es válida para k—1 vecto- 
TES Xy, Xa, -.., Xk-1 Y Aceptemos que k vectores Propios Xy, X2, - + 
- y Xa, Correspondientes a los valores propios y, Ao, -, Ae distin- 
tos dos a dos, son linealmente dependientes 


0x4. FX = 0. (5) 


Aplicando a ambos miembros de esta igualdad la aplicación of, 
obtenemos 


mor taadxr+ ...harotx =0, 


es decir, 
AS A (6) 
Por otra parte, multiplicando la igualdad (5) por 2, tendremos 
A (Mm 


Restando la igualdad (7) de la igualdad (6), encontramos 
dr — A) (da A) art > > ha ma 2) a = 0 
puesto que, por suposición, todos los cs son distintos y, por la 


hipótesis de inducción, los vectores x;, xx, . ..., X-1 Son linealmente 
independientes, resulta 
a =0% = =4%-1=0 
y entonces de la igualdad (5) tenemos 
0%x=0 y a =0. 





¿Cómo determinar los valores propios y los vectores propios de 
una aplicación lineal? Supongamos que x es un vector propio de 
una aplicación lineal 4 y que A es el valor propio que le corres- 
ponde. En este caso, ctx = Ax. Tomemos en el espacio R una base 
cualquiera ey, €2, . .., a Y Sea 


x= Meatbxe+-. Xen 
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y A = [ax] la matriz de la aplicación A en esta base. En estas 
condiciones (véase el$ 1 del capitulo JID), 


ox = (ayx+taXa+ o. O1nXn) C14 (Um X1+ da0Xa + «2 + 
O CS A 
= 2ALe1+xee2+ o... + Xen) 


de donde, debido a la independencia lineal de los vectores er, 
2...) n resulta 


(412) A+ aax +. > «GX =0, 
Axi+ (0092) Xa +. - han kn 





(8) 





m0) + 9x2. (gn —2) Xa = 0. 


Para que exista una solución no nula de este sistema (homogé- 
neo) es necesario y suficiente que su determinante sea igual a cero: 


UA Ma... On 








O An 


(teorema 10 del capítulo 1). El primer miembro de la última igual- 
dad representa en sí un polinomio de grado n en 4 que se denomina 
polinomio característico de la aplicación ot en la base er, es, ... 
+...» €n Este polinomio es el determinante de la matriz A—AE. 
Será demostrado (teorema 6) que, en realidad, este polinomio no 
depende de cómo se elija la base y, por esto, puede ser denominado 
polinomio característico de la aplicación A. 

Hemos demostrado que todo valor propio de una aplicación A 
es raíz de su polinomio característico. Recíprocamente, toda raíz del 
polinomio característico de una aplicación A es un valor propio de 
la misma: los vectores propios correspondientes se determinan del 
sistema (8) que tiene en este caso necesariamente soluciones no 
nulas, ya que su determinante es igual a cero. 

Teorema 6. El polinomio característico de una aplicación lineal 
no depende de la elección de la base. 

Demostración. Sea p.(2) = [4—2E] el polinomio característico 
de la aplicación ot en la base €, €2, ..., €n; Supongamos que la 
base nueva e), €2, ... ., é, se obtiene de la antigua mediante la matriz 
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C. En este caso, el polinomio característico de la aplicación dt en 
la base él, €%, ..., €. €S 


Qe (0) =14'-2E| = |C24C-2E| =|CAC-C-DEC| = 
= |C-HA—AE)C| = [0-1] ¡A—2E|1C] =]|A-AE| = qu(2). 

Aquí nos hemos basado en que [C"*| |C| =|C=4C| =|E| =1. 
Sea 





PO) = (DD A A... 


el polinomio característico de la aplicación «f. Es fácil ver que 
«es igual a Ja suma dj1-+ag2+ - . - ++ dan de los elementos diagonales 
de la matriz A (esta suma se llama traza de la matriz A). Por otra 
parte, %n = p(0) es el determinante de la matriz A; luego, para que 
una aplicación «A sea no degenerada es necesario y suficiente que 
(0) sea diferente de cero, es decir, que A no tenga valores propios 
nulos. 


Ejemplo. Hállense los valores propios y los vectores propios de la aplica 
ción lineal «A de matriz 


4,2 
ls 4J 
Solución. El polinomio característico de la aplicación of es 


1-4 
PO - F 


Sus raíces son A, = 6 y A, = —1. Los vectores propios se determinan de dos 
sistemas de ecuaciones 


(AD x1+2x, =0, 
Sx+(4- A) xo = 0 


(i = 1, 2); puesto que el determinante de estos sistemas es igual a cero, ambos 
se reducen a una ecuación. 

Para 4 =6 ésta es la ecuación Sx,-2x=0 y de ella encontramos 
113 xp = 2:5 y a título de vector propio correspondiente a 4 = 6 podemos 
tomar e, = 2,5) £o cualquier otr vector maliplo dea 

Para A =—1 tenemos la ecuación x,+xp = 0,de donderesulta x, : 
y ol yector propio correspondientes a = pe 
de éste). 


A 








2] 
0 E 
4-al A—SA—6, 





% 
NO Coalo vecs alo 


Para la aplicación idéntica todos los vectores no nulos del 
espacio son, obviamente, vectores propios con el valor propio 
igual a la unidad. 
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Para la aplicación nula todos los vectores no nulos del espacio 
son vectores propios con el valor propio igual a cero. 


Hallemos también los valores propios y los vectores propios de las aplicacio- 
nes de 1 a5del$1. 

1. Rotación del plano de ángulo p. 

El polinomio característico es 


cosp—A —snp 


q = M-2c0s 9141. 
snp  cosp-A 


Sus raíces son complejas: A, ¿ = cos p:El sen y. Luego, esta aplicación no 
tiene, en general (no siendo p múltiplo de 2), valores propios (reales). 
; Si q bl plcación es lat y ndo vosir es un vector propio 
con A 

Si p = (2+1)x, la aplicación es la simetría central y cualquier vector del 
plano será, obviamente, un vector propio con el valor propio iguala —1. 

2, Rotación de ángulo q del espacio de tres dimensiones alrededor del eje Oz. 
El polinomio característico es 


cosp=4 —snp 0 

seno cosp=4 0 
0 0 tk 
Sus raíces son 4, = 1, Ay, ¿ = Cos pi sen p. 


y 
Supongamos que p no es múltiplo de 2%, Los vectores propios correspon- 
dientes al valor propio 4 = 1 se determinan del sistema de ecuaciones 





eN = (1-2) (2005 p:1+1). 








(cos p—1) x,—sen p-xe = 0, 
sen p-x1+(cos p=1) xp = 0. 


Puesto que el determinante de este sistema (homogéneo) 


cosp=1 —senp . 
=1-2c05p+1 =4sen? 
np beca dd 7 


es diferente de cero, su solución es xy = xa = 0; xy es en este caso arbitrario y 
un vector propio será, por ejemplo, el vector ea = (0, 0, 1) (y todos los vectores 
multiplos de éste). 

Si q = 2ntk, la aplicación es la idéntica. 

Sig = (2£+1)a, la aplicación es la simetría respecto al eje Oz. Al valor 
propio A = 1 le corresponde, igual que antes, el vector propio e, = (0, 0, 1). 
Zos vectores propios correspondientes al valor propio 22, = —1 se determi- 
nan del sistema de ecuaciones 


sen me xy (cos +1) xq = 0, 


pa a—senex, =0, 
2x =0, 
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que se reduce a una ecuación: xa = 0; por consiguiente, para A = —1 los 
vectores propios serán todos los vectores de tipo ae, +$es. 

3. Proyección del espacio de tres dimensiones sobre el plano x0y. El polino- 
mio característico es 


q) = AIF, 


Sus raíces son A = 0 y 4, ¿ = 1. Para 4 = Olos vectores propios se determinan 
del sistema x, = O y xz = 0. Son los vectores múltiplos de ey. Para A =1 el 
sistema se reduce a una ecuación xy = 0 y los vectores propios son los vectores 
de tipo aey-+ Bey. 

4. Simetria del espacio de tres dimensiones respecto al plano xOy. El polino- 
mio característico es 


YA = (142 (1-4 


Sus rafces son 4, = —1, y Ay, 4 = 1. Para 4 = —1 se obtiene el sistema x, = 0 
y xa = 0 y los vectores propios son los vectores múltiplos de ey. Para A= 1 el 
sistema se reduce a una ecuación xy = 0 y los vectores propios son todos los 
vectores del plano x0y. 

5. Derivación en el espacio de los polinomios P, 
tico es p(A) = (1), Sus rales 300 dy y > 
correspondientes se determinan del 








El polinomio caracterís. 
O. Los vectores propios 








2=0%=0...,x=0 


y. por consiguiente, todos E vectores propios son multiplos de e (es decir, 
los polinomios de grado cero) 
"Volvamos a considerar el ejemplo (pág. 125) de la aplicación lineal de 


matriz so La E . Según hemos visto, su polinomio característico es 
pl) = 41-546, CIS 


sabs <= 


«Introduciendo» en ds la matriz Aen e A, obtenemos 


em ars4móz o [3 zl- s[; [3 -(2 a. 


es decir, la matriz mula. Vemos, pues, que la matriz 4 es una «raiz» de su 
polinomio característico. Esto es válido para cualquier matriz cuadrada. 

Teorema 7 (teorema de Hamilton — Cayley). Toda matriz cuadrada es 
una ralz de su pr rato 


Ain 





Demostración, el, polinomio y(2) = JAE—A], que sólo 
difiere del olncalo cu pi $(2) de la matriz Á sólo en el factor (1), 
y demostremos que y(4) = O. 

Indiquemos por 8 la matriz adjunta de AE 4 ($2 del capítulo TI). Tene- 
'mos, entonces, la siguiente identidad respecto a 4 


(EA) B = |AE-A!E. 
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Los elementos dela matriz B 900 polinomios en Ade grado no mayor quen—1. 
ea 






O E 
| NE 





2H. + 


ia BH BARBA AB 





Sip (2) = P4xpri4.. . st, tenemos 
OEA (B +A B ABBA 4878, ) y (ME= 
4d. +a)E. 


Como esta relación es una identidad respecto a 4, deben coincidir los coeficien- 
tes de las potencias iguales de 4 en ambos miembros: 








Baz E, 
Ba. 
B, 
By AB, = OE, 
AB, =%E. 





Multiplicando estas igualdades a la izquierda por 4%, A%=%,..., 4, E, 
respectivamente, y sumándolas, obtendremos en el primer miembro la matriz 
nula y en el segundo miembro la expresión 4*+2,4'14...+2,£ = y(4), de 
donde resulta precisamente que y(4) = 0. 


Según hemos visto (ejemplo 1 de la pág. 126), no toda aplica» 
ción lineal posee al menos un vector propio y, por consiguiente, al 
menos un subespacio invariante de dimensión uno. A! mismo tiempo 
tiene lugar el teorema siguiente. 

Teorema 8. Toda aplicación lineal posee un subespacio invariante 
de una o de dos dimensiones. 
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Demostración. Si -el polinomio característico de la aplicación 
of tiene al menos una raíz real, esta aplicación posee'un vector 
propio y, por consiguiente, un subespacio invariante de dimensión 
uno. Supongamos ahora que todas las raíces del polinomio carac- 
terístico de la aplicación ot son complejas y sea 4 = «a+ ¡8 una de 
ellas. Resolviendo para este valor de 4 el sistema de ecuaciones (8), 
obtendremos las soluciones (complejas) respectivas 2, = x1-+ 11, 
Za =Xa+biYa, ++. Za = Xabiya y, por consiguiente, tendrán lugar 
las igualdades 

ana +iy) + aa tiva)... +am(xntiya) 

= (a+ 18) Ca +1), 


A A O) 








ati) + aaa tiva). 


= (a+ iB) (+ iy). 


Igualando las partes reales e imaginarias, obtenemos dos sistemas 
de igualdades: 


AyXiHOpXa+ o. aX = 0x1 —Byr, 















Ox Oaxa do. aX = XP), 0) 
Ava Haaxad EX = 0X a BY m 
y 
GUY HAY +. HO = y + BXa, 
Ogyit Opa... +O2Yn = Ya + BXa, > 
(10) 





OmYP1i+QmY2+ ban Ya = Un PX 

Consideremos dos vectores (reales) 

U= AO +xe 4 Xen 
ES 

D= prerHJoe+ + nene 
Las igualdades (9) muestran que ctu =au—fv y las igualdades 
(10) muestran que otv = av+fu; pero en este caso el subespacio 


5-30 
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Ri generado por los vectores uy ves invariante respecto a cf ya 
que siendo x € Ri, es decir, siendo .x = 5u+71, también el vector 


Ax = tdu+ndo = Eau—Bo)+nlav+ Bi) = (ub+Prju+ 
+(0n—Bljo 


pertenece a R,. Este subespacio es bidimensional porque si los 
vectores y y v fuesen linealmente dependientes, tendríamos Y = yu y 


Au =au—Bo =(a—Pyju, 


es decir, el vector u sería un vector propio de la aplicación Ak 
correspondiente al yalor propio real a —By. 

Teorema 9. Si ot es una aplicación lineal no degenerada y 
Ry es un subespacio invariante respecto a ct, Ri es también invariante 
respecto a Al. 

Demostración. Sea e, €2, ..., e, una base del subespacio R,. 
En este caso los vectores ote, ote», . .., ote, también pertenecen a 
Ri (por ser Ri invariante), son linealmente independientes (véase el 
$ 6) y, por consiguiente, también constituyen una base de Ry, es 
decir, un vector cualquiera x € R, puede ser representado en la 
forma 


x=ade+mder+...+aote,. 
Pero entonces también 
Ax = aer +hoer+.- +0er ER. 


Fijémonos, finalmente, en un detalle que será útil en lo sucesivo. 

Observación. Sea cf una aplicación lineal cualquiera de un 
espacio R de n dimensiones que se descompone en la suma directa 
R= R¡0 Ro de subespacios suyos Ri y Ra invariantes ambos 
respecto a of;sea ey, €, - ..; €, Una base de Ri y SCA €r4 1) Cr42y >... 
£n una base de Ra. Puesto que los subespacios R, y Rason invariantes 
tienen lugar ¡as igualdades 

Ae = Quest anert ..- ant, 





$ 7. Subespacios invariantes. Vectores y valores propios 131 





(ya que Aer € Ri parak =1,2,...,ryterER, parak =r+1, 
r+2, ..., 1). Porello la matriz de la aplicación ct en la base €, 
2, « » », €n de todo el espacio adquiere la forma 


Mu Ga... Gr 0 0 «7. D 





A= S 
m2 
0 0 a 0 Arda er Ann 
Se puede decir que la matriz 4 se descompone en «células» 
A a 07 
0 A 


donde 41 es la matriz de la aplicación A en el subespacio Ri, 4g 
es la matriz de la aplicación ct en el subespacio Ra y las matrices 
rectangulares que figuran en el ángulo inferior izquierdo y en el 
ángulo superior derecho están formadas por ceros. 

Por consiguiente, conociendo las matrices A, y Az de la aplicación 
ot en los subespacios R, y Ra podemos formar con ellas la matriz de 
la aplicación Á en todo el espacio R. 


CAPÍTULO IV 


ESPACIO EUCLÍDEO 


$ 1. Producto escalar 


Hemos definido los espacios lineales, cuyos vectores pueden ser 
sumados y multiplicados por números, hemos introducido Jos 
conceptos de dimensión, de base y de aplicación lineal y ahora 
introduciremos la métrica de estos espacios, es decir, el método que 
permite medir las longitudes y los ángulos. Existen diferentes formas 
de definir la métrica de un espacio lineal. Optaremos por la forma 
que: se basa en el concepto de producto escalar. En el espacio co- 
rriente de tres dimensiones se llama producto escalar de dos vectores 
al producto de sus longitudes pos el coseno del ángulo que forman 
estos vectores. Por consiguiente, el producto escalar (x, y) de dos 
vectores x e y es una función de dos variables (vectores) que, como 
se sabe, posee las propiedades siguientes: 

1, Para cualesquiera dos vectores x e y se tiene 

(5,3) =0,) 

piedad conmutativa del producto escalar). 

2. Para todo vector x y cualquier núenero real «: se tiene 

(ax, y) = ax, y) 

(propledad asociativa del producto escalar respecto a la multipli- 
cación de los vectores por los números). 

3, Para cualesquiera tres vectores x, y y z se tiene 

(e+y, 2) =(% 2340) 2) 

(propiedad distributiva del producto escalar respecto a la adición 
de los vectores). . 

4. Para el cuadrado escalar de cualquier vector x se tiene (x, x)== 0 
y de la igualdad (x, x) = 0 se deduce que x = 0 (propiedad positiva 
del producto escalar). 
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En el caso de un espacio lineal general no disponemos de los 
conceptos de longitud y de ángulo y, por ello, introduciremos el 
producto escalar axiomáticamente. 

Definición 1. Diremos que en un espacio lineal R está definido 
el producto escalar si a todo par de vectores'x e y de R corresponde 
un número (x, y) que cumple las condiciones 1, 2 y 3. (Estas condi- 
ciones pueden ser llamadas axiomas del producto escalar.) 

Un espacio vectorial provisto de un producto escalar que, además 
de las condiciones 1, 2 y 3, cumple también la condición 4 se denomina 
espacio vectorial euclídeo. 

De las igualdades 1, 2 y 3 se deducen fácilmente las relaciones 
siguientes: 


2. (x,ay) = (ay, x) =a(y, x) = a(x, y). 
3. (2, x4y) = (24), 2) =(%, 240), 2) = (2, x)+(z, y). 


Ejemplos. 


1. Supongamos que en un espacio vectorial de n dimensiones se ha fijado 
Una base determinada; en este caso el producto escalar de los vectores 


XA (A Xos 000 X) 0 Y Mis ds +01 70) 
se puede definir mediante la igualdad 

06) A DEAD > Ed 0) 
(las condiciones 1, 2, 3 y 4 se comprueban directamente). 

2. En el espacio P de los polinomios en £ y en el espacio C de las funciones 


continuas sobre el segmento (a, b] el producto escalar se puede definir mediante 
la igualdad 





Ñ 
(56) fa070 de o 


(es evidente que se cumplen las condiciones 1, 2 y 3; también se cumple la 
condición 4, ya que una función continua no negativa de integral igual a cero 
es idénticamente igual a cero). 


Definición 2. En wn espacio euclídeo se llama longitud o módulo 
de un vector x a la raíz cuadrada de su cuadrado escalar: 

[x1=V6 3: 
El ángulo p entre los vectores x e y se define mediante la igualdad 


cos TS , 6) 
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Demostremos que en cualquier espacio euclídeo el ángulo puede 
ser definido de esta forma, es decir, que el coseno del ángulo entre 
vectores, introducido mediante la fórmula (3), no sobrepasa por su 
valor absoluto a la unidad. 

Debemos comprobar que 


5) 
Al 


Es suficiente demostrar para ello la desigualdad de Cauchy — 
Buniakovski: en un espacio euclídeo R se tiene para todos los 
xey 

ES 

Demostración. Sea « un número real arbitrario. Debido a la 
condición 4, para el vector x--xy se tiene 

(e-ay, x—ay)> 0, 
de donde, basándose en las condiciones 1, 2 y 3, obtenemos 

(6, )-2a(x, y) +30, y) 0. 


Aquí figura un trinomio de segundo grado en «. Puesto que él es no 
negativo cualquiera que sea el valor dex, no puede tener dos raíces 
reales distintas y, por consiguiente, su discriminante es no positivo: 
(9 1xP1yP=0 
que es lo que se quería demostrar. 
Es fácil ver que la igualdad (x, y)? = |x|? | y |? se alcanza si, y 
sólo si, existe un número tal que xx» = 0, es decir, si los vectores 
xe y son proporcionales: 


x=a). 

La desigualdad de Cauchy — Buniakovski, aplicada al espacio provisto: del 
producto escalar (1) lleva a la «desigualdad de Cauchy»: 

(ajbr+ombr+..+0b Yi 

<(f+aj+...+oD (RI... +bD, 

válida para cualesquiera números a, y by y aplicada al espacio C con el producto 
Sirio len la dial de Buniakovskb»: 

[i 0704) < j bye j DOI, 


válida para cualesquiera dos funciones continuas x(1) e x(1). 
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En_un espacio cuclídeo se cumple también la desigualdad 
triangula 


lar: 
yl lxielyl 

Demostración. Empleando la desigualdad de Cauchy-—Bunia- 
Kkovski, encontramos 

XEp IP = (y, xy) = (6, 942% Y)+ 0, Y) 
= [114205 +19 |xP42]x1 19 1+1yP = (141709 
de donde resulta 

xy] <= xl+/yl 

Dos vectores x e y se llaman ortogonales si el producto escalar 
(x, y) de estos vectores es igual a cero, 


En cualquier espacio euclídeo es válido el «teorema de Pitágoras»: 
si los vectores x e y son ortogonales, se tiene 


xy [xP yl 
Efectivamente, siendo (x, y) = 0 se tiene 
yl [x942 +4 y 8 [xy 1 








$2. Base ortonormal 


Definición 3. Una base €, es, ..., en de un espacio euclídeo se 
llama ortogonal, si 

(er, ex) =0 parai A k. 
Si se tiene, además, 

le] =1parai=1,2,...,n, 
se dice que la base es ortonormal. 


'Lema. Los vectores no nulos ortogonales dos a dos son linealmente 
independientes. 


Demostración. Supongamos que los vectores no nulos x1, 
Xa, «+», Xm Son ortogonales dos a dos: (xi, xx) = 0 para iy k. 
Supongamos que 

AX HUgX2 «Hi = O. 

Multiplicando ambos miembros de esta igualdad escalarmente por 
x,coni=1,2, ...,m, tendremos 

Als, HR ls, A+ - Html Am, M1) = 0; 
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puesto que (x;, xx) =0 para ¡4 k y (Xx; xx) 0 para todo 
i=1, > ..., Mm, de aquí resulta que «; =0 para todo ¿=1, 


2, 





pecican 1. En todo espacio euclídeo R existen bases ortonor- 
males. 

Demostración. Sea 81, 82, ..., 8n una base cualquiera del 
espacio R. Pongamos fi =81 Y fa =8ubafi y escojamos a de 
modo que los vectores f; y f2 sean ortogonales 


(getaf, fo) = (80, fi +a(f, f) =0; 


luego, 
a do 
A 


Pueto que fi »* 0, el denominador (fi, fi) de esta fracción es 
diferente de cero. El vector fa que hemos obtenido es no nulo, ya 
que los vectores g, y ga son linealmente independientes. 

Supongamos ahora que hemos encontrado ya unos vectores 
mo nulos fi, fa, ..., fx-vortogonales dos a dos. Tomemos 


hat bin 


y escojamos los números 21, %a, ...., Ax..1 de modo que el vector fx 
sea ortogonal a fi, fa, ..., fi-1. Para ello es necesario que se 
cumplan las igualdades 


Usd = (EMS $) =0 
parai=1,2,..., k-1; de aquí resulta 


= ufo 

dario 
El denominador (J,, f;) de esta fracción es distinto de cero, ya que 
todos los vectores /; con ¡=1, 2, ..., k—1 son no nulos por 
hipótesis, Puesto que los vectores gi, 82, ..., 8x SON linealmente 
independientes, el vector obtenido f; también es no nulo. 

Continuemos esta construcción hasta encontrar el último vector 
(no nulo) 


hi= erat Hans 


ortogonal a todos los: vectores anteriores fi, fa, ..., f-1. Los 
vectores fi, fa, ..., f, Son, en virtud del último lema, lineal- 
mente independientes y, por consiguiente, constituyen: una base 
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(ortogonal). Dividiendo ahora todo vector f, por su módulo, 
obtendremos una base ortonormal formada por los vectores 


e e =h 
AD ETA 

Es fácil vér que siendo la base 81, 82, ..., En ortogonal resulta 
A =8m fa =82 --» fu = En Y que siendo esta base ortonormal 
resulta ex = 81 82 = Eb +=<> En = En: 

El método que hemos aplicado para obtener un sistema orto- 
normal de vectores a partir de un sistema linealmente independiente 
dado lleva el nombre de proceso de ortogonalización. 

Observación. Si R es un subespacio de R y €1, €2, ..., €x es una 
base ortonormal de R,, los vectores es, €2, . ..., ex pueden ser incluidos 
en una base ortonormal de todo el espacio. Para demostrar esto es 
suficiente completar el sistema es, es, . . ., ex hasta obtener una base 
del espacio R y realizar la ortogonalización del conjunto obtenido 
de vectores comenzando por €, €2, ..., €k. 


Ejemplo. Hállese una base ortogonal en el espacio de los polinomios de 
grado no mayor que 4 definidos sobre el segmento [—1, 11. 
Solución. Tomemos por base inicial 


=== 09=08=0 
Pongamos 
h=g=1 de 
Y Si = Ev+% fo. Puesto que (81, 4) = f 1 dt =0, resulta a = 0 y 
a 





a 
asp e 











han=t 
1 
Pongamos después /a = £s+Bf++y fi Tenemos (gu Jo) = | vde= 2 
¿y 
1 : 1 
Ur to = fa- 2, de donde B ===, y (En f)= Jrrdi=0,escecir, 
E 
y =0. Por consiguiente, 
pt. 
1 
Sea f,= Ext Afo+ pf1+rf Tenemos (2 S) = S 1% de=0, de donde 
a 
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; 2 ; 2 3 
A 050 f0= | de SD= | dt = y, de donde pm 5» 
a 


yen /) = ¡(ora = 0, es decir, » = 0. Por consiguiente, 
Y 


pon=de 
Pongamos, o h=st cod Of, Puesto que 
auso-| nd 37 Co fi) = 2, resulta E = — tenemos, además, (gu /)= 


= juan 0. es decir, y = 0. Tenemos después 


a 
1 


aso Jules 


a 









finalmente, (% 9 = j 111) dr=0,es decir, 
Po 


7 
£ = 0. Por consiguiente, 





art 





Los polinomios obtenidos 
SobofoSa3Ji 


coinciden (salvo un factor) con los cinco primeros polinomios de Legendre que 
desen un papel importante en diferentes secciones de la Física matemá- 


Hailemos la expresión en coordenadas del producto escalar. Sea 
1 €2, --., €, Una base cualquiera de un espacio R provisto de 
producto escalar y sea 


x= Xe Hoxe FXnén € Y = ret )ota+ + Ynéno 
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Tenemos 
(e y) = E xuyiles ex) = 2 EnXiYo 


tk 
donde gu = (es, ex). Si el espacio R es euclídeo y és, 62, +, €n es 
una base ortonormal, se tiene (e, ex) = Opara de Ey (ee) =1 
para todo f = 12, ,.., 1 y, por consiguiente, 


(5 y) = AYAEXYIH + Eno 


Recíprocamente, si en una base €, €z, ..., en el producto 
escalar de los vectores 


x= XeHx0t24 2. € Y = pre yate dr > - «+ Ynén 
es igual a 
EXA EX 


es fácil ver que esta base es ortonormal, ya que en este caso (e,, ey) =1 
y (es, ex) =0 para ¡% k. Es más, si en una base determinada. el 
cuadrado escalar de un vector cualquiera x = x1e1kXzt2+ . - - +Xnén 
es igual a (x, x) =xXI4x3+...-+xj, esta base es ortonormal, ya 
que (es, es) = 1 para todo i y para ¡ 4 k tenemos 


(et ez, enter) = 
= 0407 RO LO +0 = 


(las unidades figuran en las posiciones ¡-ésima y k-ésima) y 
(ei ex, enter) = (er, e) +2le1, ex) + (ex, 4) = 24201, er), 


de donde resulta (e,, ex) = 0. 

Sea €1, €2, ..., €, una base ortonormal y sea x = x1€1+ Xy04 + 
+... Xp6n, Multiplicando escalarmente ambos miembros de la 
última igualdad por e,, obtenemos (x, es) = xy, es decir, la ¡-ésima 
coordenada del vector x en unía base ortonormal es igual al pro- 
ducto escalar de x por el-vector básico e¡. (Este producto escalar 
puede ser llamado proyección del vector x sobre el vector e,. Por 
consiguiente, las coordenadas de un vector en una base ortonormal 
son sus proyecciones sobre los vectores básicos.) 

Definición 4. Dos espacios R y R' provistos de producto escalar 
se llaman isomiorfos, si entre sus elementos se puede establecer una 
correspondencia biyectiva tal que siendo x —— x' e y « y”. donde x, 
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yER yx y ER mosólox+y—x'+y' y ax— xx" sino también 
(5 y) = (4,9). 

Teorema 2. Todos los espacios ( vectoriales) euclídeos de n dimen- 
siones son isomorfos. 


Demostración. Sean R y R' dos espacios cuclídeos de x dimensiones. 
Tomemos en cada uno de ellos una base ortonormal (£;, €j.. .£a CA R Y 65, 
es,....£, en R') y pongamos en correspondencia a todo elemento de R el ele» 
mento de R? con las mismas coordenadas; entonces, como se sabe (véase el $ 
3 del capitulo ID, a la suma de elementos de R le corresponde la suma de los 
elementos respectivos de R? y al producto de un elemento de R por un número 
le corresponde el producto del elemento respectivo de R” por el mismo número. 
Además, si 

x= Me hxet.. bx O Y = Yitrtyreh >> cb Ynn (Y, por consi 
guiente, x= xje+x0e5+..hxps e y Aer Hyae ió. oyes), tenemos 
para los productos escalares 


E A 


Luego, los espacios R y R' tienen la misma estructura; los vectores corres+ 


pondientes tienen longitudes iguales (|x] = 53) = VG%, 1) = 1.1) y los 
ángulos entre los pares de vectores correspondientes son iguales 


(605) e o = cos (257), 





$3. Complemento ortogonal 


Definición 5. Dos subespacios R, y Ra de un espacio euclídeo R se 
llaman recíprocamente ortogonales si. todo vector de Ri es ortogonal 
a todo vector de Ra (en este caso escribiremos R, L Ra). 

Así, en el espacio corriente de tres dimensiones son ortogonales 
un plano x que pasa por el origen de coordenadas (el plano se 
comprende como el conjunto de todos los vectores que pertenecen 
ax) y,la recta / perpendicular al plano (y que también pasa por el 
origen de coordenadas) (fig. 8, a). A] contrario, dos planos x y xa 
perpendiculares en el sentido de la Geometría elemental (fig. 8, b) 
no son subespacios ortogonales en el sentido de la definición dada, 
pues, de 41€ 701.y dx € 71g no resulta aun que ax ¿L dp. 

Para que dos subespacios R, y Rs sean recíprocamente ortogonales. 
es necesario y suficiente que todos los vectores básicos de uno sean 
ortogonales a todos los vectores básicos del otro. La necesidad se 
deduce dé la definición 5; para demostrará suficiencia, supongamos 
que €1, €, . .., € es una base de Ri y que fi, fas ---> fm 0s una 
base de Racon la particularidad de que (es, /;) = O pará todoi=1, 
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Fig. 8 


2, ....kyj= 1,2, ...,m;en.estecaso paratodo x = X161-+Xae2+ 
+... +xxex y para todo y = pr fi+pofat . .-+Ymfm Se tiene 


(4) = ode fa =0 


y, por consiguiente, estos vectores son ortogonales. 

Demostremos que la intersección de dos subespacios reciproca- 
mente ortogonales es el vector nulo. 

Efectivamente, sean R, y Re dos subespacios recíprocamente 
ortogonales de R. Si el vector x€R1 N Ra, se tiene xE Ri y 
x € Re; pero entonces (x, x) = 0 y, por consiguiente, x = 0. 

Sea R, un subespacio arbitrario de un espacio euclídeo R. 
Tomemos en R; una base ortonormal e), €», ..., €, y complemen- 
témosla hasta obtener una base ortonormal es, €, ....., €r, €r41 
€ de todo el espacio. Los vectores e, 1, . . ., €n generan un subesp: 
cio Ra de n—r dimensiones que es, obviamente, ortogonal a R,. 

Demostremos que todo vector x de R que es ortogonal a Ri 
pertenece a Ra, Efectivamente, si el vector 








x= X161+Xa9 4H. Xan 
es ortogonal a R,, se tiene 
(e)=x=0 para ¿=1,2,...,r 
y, por consiguiente, 


Xx Xr4 1 rg 1h 0 0 + Xen E Rao 


142 Cap. 1V. Espacio euclideo 





Definición 6. El subespacio Ra formado por todos los vectores de 
R ortogonales a todos los vectores de Ri se llama complemento 
ortogonal de Rs; indicaremos este subespacio Ra por Rf. 

Es fácil ver que el complemento ortogonal de un subespacio 
r-dimensional es de n—r dimensiones y que el complemento ortogo- 
nal de Rj* coincide'con Ri, es decir, 

(RYL = Rio 


Los subespacios R; y Rf generan todo el espacio R y la inter- 
sección de ellos es el vector nulo. Por consiguiente, el espacio 
euclideo R es la suma directa de cualquier subespacio suyo y del 
complemento ortogonal de éste: 

R=RORfÍ. 

Luego, todo vector x de R puede ser representado univocamente en 
la forma de una suma x = y+2, donde y € R, y z € Rj (teorema 
6 del capítulo 1). El vector y puede ser denominado proyección 
ortogonal del vector x sobre el subespacio R;. Se acepta que el 
ángulo entre el véctor x y el subespacio R, es iguál al ángulo entre 
el vector x y su proyección y sobre R;; por consiguierite, el coseno 
de este ángulo es igual a 
eN 041) _ 0 bib! 


CONTAINS 


Consideremos de nuevo un sistema de ecuaciones lineales 
homogéncas ES 


Aaa. pa Xs 0, 
A Ada = o 4) 





Am Xi OmoXart +; + An Xan = O. 


Se puede dar la siguiente interpretación geométrica a este 
sistema. En un espacio euclídeo R” se han fijado (en una base orto- 
normal) m vectores a; = (Aj, Gj2 ..., Mim), ¿=1, 2, ..., m. El 
problema consiste en hallar todos los vectores x = EN M2 00 .> Xn) 
ortogonales a cada uno de los vectores 41, Ga, <s -, Om 

Sea r el rango de la matriz A = [4,1]. Si el vector x'es ortogonal 
a todos los vectores a;, también es ortogonal al espacio r-dimensio- 
nal_R, que éstos generan. Por consiguiente, los vectores soluciones 
x forman el complemento ortogonal Ri- del subespacio Ri. La 
dimensión de R¿ (es decir, el número máximo de soluciones lineal- 
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mente independientes del sistema (4)) es igual, como hemos visto, 
a n—r. Todo sisiema fundamental de soluciones de las ecuaciones 
(4) es una base del subespacio Rf. 


$ 4. Espacio euclídeo (puntual vectorial) 


Sea A" un espacioafín n-dimensional y sea R” su espacio vecto- 
rial correspondiente provisto de una métrica euclídea (es decir, de 
un producto escalar que satisface a las condiciones 1, 2, 3 y 4 del 
$ 1). En el espacio A” se puede definir la distancia éntre dos cuales» 
quiera de sus puntos M y N tomándola igual al módulo del vector 
MN y el ángulo MPN tomándolo igual al ángulo entre los vectores 
PM y PN. 

El espacio 4” con la métrica introducida de esta forma se 
denomina simplemente espacio euclídeo (a diferencia del espacio 
euclídeo vectorial introducido anteriormente). 

Por consiguiente, un espacio euclídeo n-dimensional se puede 
definir mediante los cinco siguientes grupos de axiomas: 

I. Axiomas de adición de vectores (axiomas 1, 2, 3 y 4 de la 


II. Axiomas de multiplicación de un vector por un número (axio- 
ma 6, 7 y 8 de la pág. 64). 

IX. Axioma de dimensión; existen n vectores linealmente indepen- 
da pero no existe más de n vectores linealmente independientes 
(pág. 66). 

TV. Axiomas que relacionan los vectores y los puntos (axiomas 1 
y 2 de la pág. 84). 
Ñ V. Axiomas del producto escalar (axiomas 1, 2, 3 y 4 de la pág. 
32). 

Se puede demostrar que todos los espacios euclídeos n-dimen- 
sionales «tienen la misma estructura» (son isomorfos). En particu- 
lar, para n = 2 tenemos el plano corriente y para n = 3, el espacio 
corriente de tres dimensiones. 

Supongamos que en un espacio A” se tiene un plano k-dimensio- 
nal R, que pasa por el origen de coordenadas 


Ax + ax +. > +G1nXa =0, 
O Xi+axot o. Gana = 








(5 





Ami Xi + OmaXa H>H Ono Xan 
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a) 





Fig. 9 


(es decir, un subespacio k-dimensional) y un punto X(Ex, En, ..., En). 
El vector x = OX puede ser representado entonces en la forma 
x= y4+2, donde y € R, y E Rf (fig. 9, a). La longitud del vector 
z se denomina distancia entre el punto X y el subespacio Rs. 

Supongamos ahora que en A” se tiene un plano k-dimensional x 
cualguiera 


px axe +. ++ pXa = by, 





Ana Xh ama Xad + OmnXa = Dm 


y un punto X(E,, é2, ..., 54). El plano xx se obtiene trasladando 
paralelamente en un vector a el subespacio R, correspondiente a 
este plano definido por el sistema de ecuaciones (5). El punto X se 
obtiene entonces trasladando en el mismo vector a un punto deter- 
minado X (y, por consiguiente, OX= 0Xo+a; véase la fig. 9, b). 
La distancia entre el punto X y el plano k-dimensional7z se. toma igual 
a la distancia entre el punto Xp y el subespacio Ry. Un plano k-di- 
mensional x, y un plano /-dimensional m2 son ortogonales si son 
ortogonales los subespacios 2% y 13 que les corresponden, En este 
caso todo vector MN, donde M, N € zz, es ortogonal a todo vector 
PO, donde P, Q € zzz (6ig. 10). 
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Fig. 10 





En un espacio euclídeo A” se llama hiperesfera al conjunto de 
todos los puntos que se encuentran a una misma distancia r 
(radio de la hiperesfera) de un punto fijo Q (centro). La ecuación 
de una hiperesfera de radio r y de centro en el punto Q(x1,%, . . .,%n) 
en un sistema de coordenadas de base ortonormal es, evidente- 
mente, 


laa) + (xa. (xa)? = 1%. 


Queda claro así que la hiperesfera es un caso particular de ima 
superficie de segundo grado (véase el capítulo VID. 


CAPÍTULO Y 


APLICACIONES LINEALES EN UN ESPACIO EUCLÍDEO 


$ 1. Aplicación conjugada de una dada y 


Definición 1. Sea ct una aplicación lineal de un espacio euclideo 
R. La aplicación lineal A” tal que 


(Ax, y) = (x, Ay) 
para todos los x, y € R se llama conjugada de AA. 

Para toda aplicación lineal ct existe no más de una aplicación 
conjugada cA*. Esto se deduce del lema siguiente. 

Lema. Si B y € son unas aplicaciones lineales de un espacio 
Rysi 

(,3 y) = (x,€y) 


para todos los x e y de R, se tiene B = €. 

Demostración. De la igualdad (x, B y) = (x, € y) se deduce 
que 

(x, B y)-(x, € y) = (x, By-l y) =0, 


es decir, que (x, (B—€)») = 0 para todos los x e y. 
“Tomando, en particular, x = (B—€)y, obtenemos 


(2-0y, (B-€)y) =0 


y, por consiguiente, en virtud de la propiedad 4 del producto esca- 
lar se tiene (B—€)y =0, es decir, =0y para todo yER. 
Pero esto significa precisamente que B = 6. 

Demostremos ahora que para toda aplicación lineal A existe 
la aplicación conjugada A*. Sea A = [am] la matriz de la aplica» 
ción lineal 4 en una base orfonormal €, €2, . ..., €n, Sea A' la matriz 
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iespueta d 4 y ea cf la elcación ic! de mata en esa 
misma base. Es evidente entonces que 


(A es, €1) =(Auert0nést-:-+Hanitm ex) = 0% 
y v E 
len A” ex) = (er Mata»: Fer) = Opt, 
es decir, (ote, ex) = (er A*ei) para todos los iy k. Pero en este 


caso, siendo x = Exmey= É Vr, Se tiene 
la -L 


(Ax, y) = (a $ Y vés É 1) = ExpucAe,, ex) 
ds o 


(1, Aly) S É xt A da pas E xuuten Aer) = 
». 


Ex ote, ex) =(Ax, Y, 


es decir, AAA. PP 
Hemos demostrado que para toda aplicación lineal ck de un 
espacio euclídeo existe una aplicación única conjugada A*, cuya 
matriz en cualquier base ortonormal es la traspuesta de la matriz 
de la aplicación A. 
Scan ot y B unas aplicaciones lineales cualesquiera de un espa- 
cio pal R y sea É la aplicación idéntica. Entonces: 


1. €* =¿, ya que 
(E y=(0x y =(3,)) =(x Ey) 
(en otras palabras la matriz de la aplicación € en cualquier base 


A A o =E). 
2. (A*) = A, ya que indicando (A”)” simplemente por 
ck** tenemos 


(Ax, y) =(x%, A* y) =(* y, ) =0, Ax) =(A*x, y) 


(en otras palabras, la doble trasposición no altera la matriz: (4'Y' = 
=4). 
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3. (A+By =A*+B*, ya que 

(a, (A+Bly) = ((A+B)x, y) =(Ax+Bx, y) = 

= (dx, y) HBx, y) =(x, A* y) +(x, B* y) = 

=(x, A y4B* y) = (x, (4*+B")) 
(en otras palabras, la matriz traspuésta de una:suma es igual a Ja 
suma de 1 matrices traspuestas delos sumandos: (A+B)' = 
=4'4B", 

4. (AB) =B'A?, ya que 

(1 (AD) y) = (AB), y) =(A(Bx), y) = (Lx, A*y) = 

= (a BAy) = (x,(BA")y) 
(y, por consiguiente, para las matrices tiene lugar la igualdad 
(AB! =B'A'). 

5. Si existe oé”1, se tiene (Af71)* = (A*)”, ya que de la igual- 
dad otat”* E $ de los puntos 4 y 1 resulta (tA=N" = 
(AyaAr=d=b, es decir, (Ay (A*)1 (y, por 
consiguiente, para Eee matrices se tiene (471) = (4')71). 


$2. Aplicación autoconjugada 


Definición 2. Toda aplicación que coincide con su conjugada se 
llama autoconjugada o simétrica. 

Si ot es una aplicación autoconjugada, para todos los x e y de 
R se cumple la igualdad 


(Ax, y) =(x, A y). 


Sea A = [a] la matriz de una aplicación autoconjugada A 
en una base ortonormal, entonces, A' = A, €s decir, ax = Gx1. 
Toda matriz de este tipo se llama simétrica. 

La aplicación idéntica es autoconjugada, ya que E* = £. 

La suma de unas Aplicaciones autoconjugadas. es una Piro 
autoconjugada, ya que, siendo k*.= kt y B'* =D, se 

(A4DB) = A 4D ARD, 

La aplicación inversa de una aplicación autoconjugada no degene- 
rada es una aplicación autoconjugada ya que, siendo ok" = A, se 
tiene 

(ARMY = (AY = ATL 
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Para que el producto de'unas aplicaciones autoconjugadas sea 
autóconjugada es necesarió” y suficiente que estas aplicaciones 
conmuten, Efectivamente, siendo A* ot y B* =B, se tiene 
(ABI =B'A* = BA lo que es igual a AB si, y sólo si, las 
aplicaciones ct y B conmutan, es decir, si AB = BA. 

Teorema 1. Si el subespacio R, es invariante respecto a una 
aplicación lineal ot, su complemento ortogonal Ri es invariante rés- 
pecto a la aplicación A” conjugada de k. 

Demostración. Sea x un vector cualquiera de Rf y sea y un 
vector cualquiera de R,. Puesto que oty € Ri y x € Rf, €s decir, 
x.Lokty, tenemos 


(ot*x, y)= (x, ot y) =.0. 


Por consiguiente, ot* x € Rf y Rf es invariante respecto de A”. 
Corolario. Si ct es una aplicación autoconjugada y R, es un 
aleron invariante respecto de Af, también Ri es invariante res- 
pecto de 
Efectivamente, en a del teorema 1, Rf es invariante, res- 
bsp de A”; pero of” = A; luego, Rj es invariante respecto 
de ot. 


Teorema 2. Todas las raíces del polinomio característico de una 
aplicación autoconjugada ck son:reales, 

Demostración. Sea «+18 una raíz compleja del polinomio 
característico de una aplicación autoconjugada cf. Como puede 
verse de la demostración del teorema $ del capítulo III, en el espa- 
cio R existe entonces un subespacio bidimensional generado por 
unos vectores u y v tal que 

Au =0u—Po, 0) 

Av = Bujao, 


donde $ ¿4 0 y los vectores u y v no son nulos simultáneamente. 
(Si el propio espacio R es bidimensional y no existen en él vectores 
propios, este subespacio coincide con todo el R.) Multiplicando 
escalarmente la primera de las igualdades (1) por Y y la segunda por 
u, obtenemos 

(ku, 0) = a(u, e) flo, v) 

(u, cto) = Blu, 1)+ alu, 0). 
Puesto que (otu, v) = (u, cto), resulta que Aur ot) = =0, es 
decir, $ = O lo que contradice a lo supuesto. 
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Teorema 3. La matriz de una aplicación autoconjugada puede 
reducida en una base ortonormal determinada.a la forma. diagonal. 
Demostración. Sea 41 unó de los valores propios:de la aplica- 
ción autoconjugada cf. Por lo visto en el teorema 2, 2, es real. 
Indiquemos por e, el vector propio correspondiente a 41; entonces 
ote, = der. Podemos aceptar que el vector e, es de longitud uni- 
ls ya que de lo contrario podríamos sustituirlo por el vector 


Al ! ,es decir, por el vector propio unitario correspondiente a este 


mismo valor propio 41. 

Indiquemos por Ri el subespacio de dimensión uno generado 
por el vector e,. Su complemento ortogonal R¿ será invariante res- 
pecto de ot y, además, la aplicación £ continuará siendo autocon- 
jugada en este complemento. Sea 2 un valor. propio (real) de la 
aplicación ct en el subespacio Rf; indiquemos por ex el vector pro- 
pio (unitario) correspondiente; entonces 


Aer = es. 


Sea Re el subespacio (invariante) generado por los vectores ex y es; 
el subespacio RF tambiénserá invariante respecto de AH. Continú- 
ando este razonamiento, encontraremos n vectores unitarios pro- 
pios de la aplicación cf ortogonales dos<a dos (y, por consiguiente, 
linealmente independientes). En la base formada por estos vectores 
la matriz de of se reduce a la forma diagonal 





0.0... A 
El último teorema ofrece la interpretación geométrica de las 
aplicaciones autoconjugadas: si 
x= ale.  hknen 
es un vector arbitrario de.R, se tiene 
dx = xd txt o. + Xa heno 


Es decir, en la transformación de los puntos que corresponde a la 
aplicación ot el punto X (xy, Xz, . . ., Xn) Se transforma en el punto 
X'(d1X1, 2aXa, .: -, 2nX») y, por consiguiente, esta transformación se - 
reduce, en la base formada por los vectores propios de la aplica- 
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Fig. 11 


ción: ok, a n dilataciones a lo largo de los ejes de coordenadas con 
coeficientes iguales, respectivamente, 2 21, %a, . .., An (véase la fig. 
11 en la que se representa la acción de una aplicación autoconju- 
gada de valores propios A =-3 y 42 =2 sobre la figura C del 
plano euclídeo). 


$3. Aplicación ortogonal 


Definición 3. Una aplicación lineal cf de un espacio euclideo 
R se llama ortogonal si 


(tx, Ay) = (x, y) 


para todos los x e y de R. 

Es decir, toda aplicación ortogonal conserva el producto esca- 
lar y, por consiguiente, conserva las longitudes de los vectores y los 
ángulos entre éstos. 

Basta exigir, sin embargo, que la aplicación lineal conserve las 
longitudes de los vectores para que resulte ortogonal. Efectiva- 
mente, supongamos que 


lotx] =1x1 
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para todo x. En este caso 
[ok(e+y)1=|e+yl. 
Pero 
[(x+y 1? =(Alx+y), A+ y) =(Ax+ Ay, bx+ Ay) = 
=(Ax, Axd+UAx, Ay) HAy, Ay) = | Ax 4UAx, AY) + 
+ldypP 
y 
bey = (y, 4)) = (5423, 40,9) = |x 14 
+2, +1y 1%, 
de donde tomando en consideración las igualdades |tx| = |x|, 
[Ay] = |y1 y [ot(x+y)| =|x-+»] obtenemos 

(tx, Ay) = (x, y). 

Está claro que toda aplicación ortogonal transforma cualquier 
base ortonormal en una base ortonormal. Demostremos que es 
válida también la afirmación recíproca: toda aplicación lineal A 
que transforma al menos una base ortonormal en una base ortonor- 
mal es ortogonal. Efectivamente, supongamos que la aplicación A 
transforma una base ortonormal er, €», ..., en en una base orto- 
normal €, es, ..., és, es decir, ote, =ej para =1,2,..., m. En 
este Caso para x= X1014Xpe2+... EXpnén € Y = Pre + Jota... 


«Jaén 
tenemos 


Ax =x e hxe+...+X tj 

Ay = +04 h Ya 
y 

(Ax, Ay) =xY+XYIH > hX 0) = (3%, Y). 

Si ot es una aplicación ortogonal y ct* es su aplicación conju- 
gada, se tiene 

(5,9) = (cx, Ay) =(x, ANA) = (x, (*A)y) 
para todos los x e y de R. Luego, of*At =:8 (lema del $ 1), es 
decir, 

At Ani, 
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Además, la igualdad A* ot = o A* = ct”! es una condición 
necesaria y suficiente pára que la aplicación lineal of sea orto- 
gonal. De aquí resulta, en particular, que toda aplicación ortogonal 
es no degeñerada. 

La aplicación inversa de uni aplicación ortogonal es también 
ortogonal, ya que siendo ot* = A”, se tiene 

AY (A = (Aya 
(de otra forma: una aplicación ortogonal es una aplicación biyec- 
tiva del espacio R sobre sí mismo que conserva las longitudes de 
los vectores; pero en este caso la aplicación inversa posee la misma 
propiedad). 

La suma de unas aplicaciones ortogonales no es, en general, 
una aplicación ortogonal. En cambio, el producto de unas aplica- 
ciones ortogonales conserva las longitudes de los vectores y, por 
consiguiente, es también ortogonal. De otra forma: 

(ABY = BA'* = BA =(AB)"*. 

Sea A = [ax] la matriz de una aplicación ortogonal ot en una 
base ortonormal €,, €a, ..., en; puesto que ct = 4, tenemos 

SA=E, 









es decir, 
dnd... Gm] [2 da .-- Gi 
Ga a 





De aquí resulta que 
Or. «+ nitn = 0 

para ¡5 k y que 
AAA AS 


para todo ¡= 1, 2, ..., n, es decir, las columnas de la matriz A 
—-consideradas como vectores — forman ellas mismas un sistema 
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ortonormal. (Claro está, lo mismo resulta tmbién de que toda apli- 
cación ortogonal transforma una base ortonormal en una base 
ortongrmal: Jas imágenes ote, ote», ...., often de los vectores bási- 
COS €1, €2, ..., € Constituyen una base ortonormal; por consi- 
guiente, (ote, tex) = ayi: + 02024 +. . - + Gps; = 0 para ¿> k 

y (Ate, Ae) = +04... +0 =1,) 

Si ok es una aplicación ortogonal, la aplicación A* =A71 es 
también ortogonal; luego, las columnas de la matriz A", es decir, 
las filas de la matriz A, también constituyen un sistema ortonormal: 


Anda +anara+.. Qing = 0 


para ¿4 k y 
ahtah+.. += L 
Toda matriz A tal que 
A=A7 


se llama matriz ortogonal. Por consiguiente, la matriz de una apli- 
cación ortogonal es ortogonal en cualquier base ortonormal; 
recíprocamente, si en alguna base ortonormal la matriz de una 
aplicación ct es ortogonal (471 = 41), se tiene ofi =A* y la 
aplicación ct también es ortogonal. 

El determinante de una matriz ortogonal es igual a +1. Efectiva- 
mente, de la igualdad 44' = Eresulta 

144'[=/4]14'| =|E|=1. 
y puesto que | 4'| =|A4|], se tiene 

l4P=1 y l4l=z1 


Teorema 4. Los valores propios de una aplicación ortogonal son 
iguales a +1. 

Demostración. Sea x un vector propio de una aplicación 
ortogonal ot y sea A el valor propio que le corresponde. Entonces, 

(x,x) = (dx, Ax) = (Ax, 2x) =44x, x), 
de donde obtenemos (ya que (x, x) * 0) 

M=1l y i=kL 

Teorema 5. Si el subespacio R, es invariante respecto a una 


aplicación ortogonal A, su complemento ortogonal R también es 
invariante respecto a A. 
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Demostración. Puesto que cf'es una aplicación ortogonal, 
tenemos ot71 =of*. Según el teorema 1, el subespacio R| es 
invariante respecto a la aplicación t* =of”1; pero en este caso 
también será invariante, en virtud del teorema 9 del capítulo MI, 
respecto a (A71)*= A. 

Analicemos qué es lo que representa una aplicación ortogonal 
arbitraria, Sea primero ot una aplicación ortogonal de la recta RY 
y sea e € Ri. Entonces, se tiene ote € R* y, por consiguiente, 
che = de, donde 2 = tl, es decir, ote = te y ot es o bien la 
aplicación idéntica o bien la simetría central. 

Sea ahora df una aplicación ortogonal del plano y sea 


A [a | 
da da 


su matriz en una base ortonormal. Como sabemos, debe ser 
dia =1, 
ata = 1, 
Arit12+ Onda = 0. 





De las dos primeras igualdades resulta que existen unos p y y 
tales que 


Ay =C0SP, Uy =SEDP Y Mm=C0SY, Am = SEN Y. 
La tercera igualdad implica entonces 
cos p-cos y-+sen p-sen y = cos (pp) = 0, 
de donde resulta que 
Ed ln 
vo= 6. 


Enel primer caso se tiene 412 = Cos y = —SEn , Mae = sen y = 
= cos p y 


de o 


es decir, la aplicación A es la rotación de ángulo y alrededor del 
origen de coordenadas. (En particular, para p =0 se tiene la 
aplicación'idéntica y para y =x1 se tiene la simetría respecto al 
origen de coordenadas.) 
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En el segundo caso tenemos 412 = Sen p, = —Cosp y 
a [as 2d 
senp —cosp 


Esta matriz es simétrica y, por consiguiente, la aplicación ortogo- 
nal ot es autoconjugada, es decir, en una base ortonormal (en gene- 
ral, nueva) su matriz se reduce a la forma diagonal 


4= [7 2) 
0% 


donde 4, = +1. El determinante de esta matriz es igual a 212 y, 
por otro lado, debe ser igual a 


cosp  senp 
senp —cosp 


luego uno de los valores 7, es igual a —1 y el otro a +1 y la matriz 
de la aplicación ot es de la forma 


A= [ e :] , 
0 -1 
Un vector cualquiera x, igual en la base nueva a x1€1+x02, se 
transforma en x' = x101—xzez. Se trata, pues, de la simetría res- 
pecto a la recta determinada por el vector e,, es decir, por el primer 
vector básico de la base nueva (5g. 12). 

Por consiguiente, una aplicación ortogonal del plano es o bien 
una rotación de ángulo p alrededor del origen de coordenadas (en 
particular, la aplicación idéntica o la simetría central; el determi- 
nante de esta aplicación es igual a +1) o bien una simetría axial 
(con el determinante igual a —1). 

De lo demostrado se desprenden, en particular, dos teoremas 
de la geometría elemental (plana): 

1. El producto de dos simetrías axiales es una rotación alrededor 
del punto de intersección de los ejes de simetría (ya que es una apli- 
cación ortogonal de determinante igual a +1). 

2. El producto de una rotación y de una simetría respecto a un 
eje que pasa por el centro de rotación es úna simetría respecto a un 
eje nuevo que pasa por el mismo punto (ya que es una aplicación 
ortogonal de determinante igual a —1). 

Pasemos ahora al caso general de una aplicación ortogonal de 
“un espacio de n dimensiones. 


=-1; 
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x! Fig. 12 


Teorema 6. La matriz de una aplicación ortogonal se reduce en 
una base ortonormal determinada a la forma 





COS p1—sen pa [0] 
senp1 cospL 
COS pa —sen pa 
Sena Cosqa, 
"COS a —Sen Ph 
Sen px  00S pk 


(Todos los demás elementos de esta matriz son iguales a cero.) 

Aplicaremos para la demostración el método de inducción 
matemática. Hemos visto ya que el teorema es válido para n = 1 
yn =2. Supongamos queel teorema es válido para todoslosespacios 
de dimensión menor que n. Sea R un espacio euclídeo n-dimensional 
y sea of una aplicación ortogonal. Pueden darse dos casos. 

1. La aplicación Cf tiene un valor propio real A =+:1 (necesaria- 
mente se da este caso si, por ejemplo, n es impar). Sea e, el corres- 
pondiente vector (unitario) propio (de modo que A e =ie) 
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y sea Ri el subespacio de dimensión uno generado por el vector €. 
Según el teorema 5, el subespacio R¿ de n—1 dimensiones es i 
variante respecto de cf. Está claro quetambién en este subespacio of 
es una aplicación ortogonal. Por la hipótesis de inducción, en Rf se 
puede encontrar una base ortonormal e», ey, ..., en en la que la 
matriz de la aplicación ot se reduce a la forma (3). Teniendo en 
Cuenta la observación hecha en el $7 del capítulo II, obtenemos que 
(alterando posiblemente la numeración de los vectores básicos) 
la matriz de la aplicación cf en todo el espacio R se reduce a la 
forma (3) en una base ortonormal determinada. 

2. La aplicación ok no tiene valores propios reales. Potlo visto en 
el teorema $ del capítulo II, existe en R un subespacio invariante 
Ri de dos dimensiones. Según hemos demostrado anteriormente en 
el plano R, se puede encontrar una base ortonormal e, y es en la 
que la matriz de la aplicación ct se reduce a la forma (2). (El segundo 
caso lo e no puede presentarse, ya que hemos aceptado que 
la aplicación ct no tiene valores propios reales.) 

El subespacio Rj* es invariante respecto a AA y en él tes, por 
supuesto, ortogonal. Por la hipótesis de inducción, se puede encon- 
trar en Rí* una base ortonormal es, e4, e, €n la que la matriz 
de la aplicación ct se reduce a la foz (3). (En este caso n es 
necesariamente par y la diagonal principal de esta matriz no con- 
tiene los números +1 y —1.) En virtud de la observación del $ 7 
del capítulo III, resulta que la matriz dela aplicación ct, considerada 
en todo el espacio R, se reduce a la forma (3) en la base ortonormal 
eL lb 2.21 En> 

Del último teorema se puede extraer la interpretación geométri- 
ca de una aplicación ortogonal. Puesto que toda matriz de tipo (3) 
es el producto de varias matrices de tipo 


1 











-1 (4 
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y de varias matrices de tipo 


resulta que toda aplicación ortogonal ct se puedeefectuar realizando 
sucesivamente varias simetrías respecto a los «hiperplanos coorde- 
nados» (la matriz de cada una de estas simetrías es de la forma (4)) 
y varias rotaciones alrededor de unos «ejes de n—2 dimensiones», 
es decir, unas rotaciones que representan giros idénticos que se 
realizan simultáneamente en todos los planos bidimensionales 
perpendiculares al «eje» de rotación de n—2 dimensiones (la matriz. 
de cada una de estas rotaciones es de la forma (5)). 

Uniendo dos +1 o dos —1 consecutivas de la matriz (3) en 
«células» 


E ¿| [EE —sen 0 Eo :] 
= y = 
01 senOó  cos0 0 —-1 
seso al 
sen cosm)” 
obtendremos (después de cambiar, posiblemente, la numeración 
de los vectores básicos) cuatro tipos de matrices ortogonales (se han 
sombreado las «células» de tipo (E q ?] , donde p puede 
senp  cosp 


ser igual, en particular, a cero o a 1; todos los elementos de las 
células vacías son iguales a cero): 
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Jl 





























si JA 
$ 4. Aplicación lineal no degenerada arbitraria 


Lema. Si ct es una aplicación lineal no degenerada arbitraria 
de un espacio euclídeo, la aplicación A*A (así como la aplicación 
Act") es una aplicación autoconjugada y todos sus valores propios 
son positivos. 

. La aplicación B =«A*A es autoconjugada, 
ya que 

Ba(AAY= KA" = AA =D, 


Sea ahora €1, €2, , e, una base ortonormal tal que la matriz 
dela aplicación autoconjugada 3 se reduce en ella a la forma dia- 
gonal 
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En: esta base se tiene Be, =Aye,. Por ello, six = xie1+xe2+ 
+... -+xnén es un vector cualquiera de -R, resulta 
(Bx,) =(aBe+aBert...+x Bes, Matet... + 
HXptn) = 
= (het xodaeo +. - > HXnbine mo MC Xa +. > AXE) = 
SARA hn 





Por otro lado, 
(Bx, x) =(A*oAx, x) =(Ax, Ax) > 0, 


ya que para x 7 0 es.otx x 0 (pues Ja aplicación At es no degene- 
rada); por consiguiente, 2P+2244+. ..+Apx7 > 0 para cuales- 
quiera X1, Xa, «+.» Xno e 0 ya que, si al menos 
uno de estos coeficientes, digamos Ax, fuese no positivo, para el 
vector x = ez resultaría (Bx, x) = 4; =<=0 lo cual es imposible. 

Teorema 6. Toda aplicación lineal no degenerada <A de un espacio 
euclideo puede ser representada como el producto 


ot = 2% 
de una aplicación autoconjugada € y una aplicación :ortogonal 26. 
Demostración. Tomemos como base del espacio R aquella 
en la que la matriz de la aplicación (autoconjugada) B = A*A se 
reduce a la forma diagonal 





0.0... A 


donde todos los 4: > 0, e reir por € la aplicación cuya 
matriz en esta misma base es de la forma 


Vh 


o 


Queda claro que € es una aplicación autoconjugada no Er 
rada y que €*.=3, Si ahora ct = 28, tenemos W = 
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y resta probar solamente que la aplicación 26 es ortogonal. Pero 
esto resulta de la igualdad 


ID = (ACI) ACA = (O ALA 
= BO = CIO E 


y con esto queda demostrado el teorema. 

Podríamos demostrar de la misma forma que la aplicación 
ct puede ser representada en la forma dt = 0,261, donde €, es 
una aplicación autoconjugada y 26, es una aplicación ortogonal. 
Por consiguiente, toda aplicación lineal no degenerada .se reduce 
a varias simetrías respecto a hiperplanos, a varias rotaciones alre- 
dedor de «ejes» de n—2 dimensiones y a varias dilataciones a lo 
largo de rectas recíprocamente ortogonales. 


$ 5. Espacio lineal complejo 


Todo cuanto hemos expuesto hasta el momento se refería al espacio lineal 
real. Un espacio lineal A rd para los cuales 
están definidas dos oy iones: —la de adición y la de multiplicación por 
números complejos - y se cumplen las condiciones de la 1 a la 8 del $ 1 del 
capítulo 1L. Un espacio euclídeo es un espacio lineal complejo en el 

O definido el producto escalar (en gene- 
opio (x, y) con la particularidad de que se cumplen las condiciones 


E (9) = 0,0%; 
2. (2%, Y) = 4 (x, Y) 
3 (4,0) =(0D+0, 2) 
¿e tfó danos 'egativo y dela igualdad (x, 1) = Ose deduce que 


De las condiciones 1, 2 y 3 obtenemos: 

2, (x, 09) = (uy, x) = «al )= 20, 0) = 20,2) = a Y» 

3. (14) = (+7, D= D+40,2)= (5 D+0,2)= (94, y). 

Igual que antes la longitud del vector x se define por Víx, 2). Dos vectores 
x e y se llaman ortogonales, si (x, y) = 0. El concepto de base ortonormal se 


introduce igual que antes y de la misma forma se puede demostrar que toda 
base puede ser convertida en una ortonormal. Igual que en el-caso del espacio 


» Ea la Hitratra cientifica stos espacios so llaman unitarios y el término 
cespacio cuclideo complejo» se emplea en gro senti 
* Por £ so designa el número conjugado de a. 
» Observemos que de la condición 1 aplicada a dos vectores iguales 
(rx) = (573) se deduce que el cuadrado escalar (x, x) de cualquier vector 
debo ser real. 
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real se introducen los conceptos de aplicación lineal, de su matriz en una base 
dada y de la multiplicación de aplicaciones lincales y de matrices. Tampoco 
varía la definición de los conceptos de subespacio invariante, de vector propio y 
de valor propio de una aplicación lineal. El primer teorema nuevo afirma: 
“En un espacio lineal complejo toda aplicación lineal tiene al menos un vector 


propio. E 
Esto se deduce del as! llamado «teorema principal del Algebra», según el 
<ual toda ecuación de coeficientes. complejos tiene al menos una raiz (en general, 


loja). 

Una aplicación. autoconjugada-de un espacio euclídeo complejo se define 
por la coudlción: (Ax, y) = (x, Ay) para todos los x e y. La matriz de una 
aplicación autoconjugada en cualquier base ortonormal satisface a la condición 
A= A", donde” A es la matriz cuyos elementos son los conjugados de los 
elementos correspondientes de la matriz A. 

Demostremos de nuevo que todos los valores propios de una aplicación 
autoconjugada son reales, Sea x un vector de una aplicación autoconju- 
gada ot y sea 4 su correspondiente valor propio; en este caso, 


(tx, x) = (x, olx) 


(xx) (5, 40, 
de donde resulta 


Mx, x) = Mx, x) 


y, puesto que (x, x) »4 O, se tiene 4 = 1, es decir, 2 es real. 

Una aplicación lineal de un espacio euclídeo complejo se Hama unitaria si 
(Ax, Ay) = (x, y) para todos los x, y € R. Si A = [au] es la matriz de una 
aplicación unitaria en una base ortonormal, se tiene 


AM= NA =E, 
es decir, aydn+tanda+...+Gind =1 Y adn+agáa+..-+0dya = 0. 
parado e Una matriz de este tipo se llama unitaria. 
Demostremos que enn espacio ucldeo compleo el valor absoluto de todoslos 
valore propos de una aplicación unitaria es ¡pal la unidad, Sea cf u0a sol 
le 


cación unitaria, sea x un vector propio misma y sea A el valor propio 
correspondiente, En estas condiciones 


(6,1) = (tx, oo) = (15,20) = Mx, 2). 


Puesto que (x, x) 24 0, se tiene 24 =1, Elo har 
Se puede demostrar que en un espacio euclídeo complejo la matriz de una 
aplicación unitaria e reduce a laforma diagonal 





ON 





donde todos los valores propios 4,son de módulo igual 2 la unidad. 
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Los valozes propios de una aplicación:autoconjugada son reales; los valo- 
res propios de una: aplicación unitaria. son de módulo igual a la unidad. Entre. 
todas las aplicaciones lineales de un espacio euclídeo. 





complejo puede ser representada en la forma of = B+€ 1, donde B y €son 
aplicaciones autoconjugadas e í'=-4/—1. Mayor contenido tieñe otro teorema, 
análago al teorernz sobre la representación de-cualquier número: complejo en 
la forma del producto de un número real positivo por un número de módulo 
igual a: la unidad («forma trigonométrica» de un número complejo): 

Toda aplicación lineal no degenerada cA de un. espacio euclideo complejo 
puede ser reprosentada ercla forma cf. = 26€, donde € es una aplicación definida 
positiva y 26 es una aplicación unitaria. 

Para el caso del espacio euclídeo real el teorema correspondiente ha sido 
demostrado anteriormente. En el caso del espacio complejo la demostración 
es análoga. 


CAPÍTULO VI 


FORMAS BILINEALES Y CUADRÁTICAS 


Los resultados de los cinco primeros parágrafos de este capítulo 
se refieren a'un espacio lineal arbitrario. La métrica (euclídea) sólo 
se emplea en el último, es decir, en el sexto parágrafo. 


$ 1. Función lineal y forma lineal 


Definición 1. Se dice que en un espacio vectorial R está dada 
una función lineal f(x) si a todo vector x € R le corresponde un múme- 
rof(x)con la particularidad de que se cumplen las condiciones si- 
guientes: 

164) SICOIALS O), 

2.f(1x) = (0, 
donde x e y son unos vectores arbitrarios de R y a es un número real 

lera. Ñ 
Para encontrar /a expresión de una función lineal en coordenadas 


tomemos enel espacio R una base €1, €2, . .., €n- Six = X1€1+Xot2+ 
+... +x,enes un vector cualquiera de R, se tiene 


FO) =/(MA+ xt +... Xen) = 
=xf (0) +xf (004... +xf (en). 
Por consiguiente, siendo fija la base, toda función lineal f(x) 
se representa mediante una forma lineal 
F) = ax +0 + -..+GrXn, 


donde Xi, Xa, - - -, Xn SOn las coordenadas del vector x y a, =/(e1) 
son unos coeficientes que no dependen de x. 
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Ejemplo. Sea a = (41, 42, ..., an) un vector cualquiera de un 
espacio euclideo R y sea f(x) = (a, x) para todo x. En este caso 
f(x) es una función lincal, pues, 


FE+y) = (a, x+y) =(a, x) (a, y) =S09+F0) 
y 
Fax) = (a, ax) =a(a, x) =2f(x). 


(En el caso de los espacios euclídeos este ejemplo tiene un carácter 
general: si en R se toma una base ortonormal €, €2, . . ., €m Para 
toda función lineal f(x) se puede indicar un vector a tal que f(x) = 
= (a, x) cualquiera que sea x.) 


$2. Función bilineal. Formas bilineal y cuadrática 


Definición 2. Una función de dos variables A(x, y) definida en un 
espacio lineal R se llama bilineal si es lineal respecto a y para x fijo 
y €s lineal respecto a x para y fijo. 

Es decir, si A(x, y) es una función bilineal, se tiene 


Ay, 2) = A(%, +A, 2), 
Alux, y) =xA(x, y), 
Á(2, x+y) = Alz, x)+A(2, y), 
A(x,2y) =0.4(x, y). 
para todos los x, y, z € R y para cualquier número real a. 
El producto escalar (x, y) es un ejemplo de una función bilineal, 


Hallemos la expresión de una función bilineal en coordenadas. Sea 
Cr, Co, en una base del espacio R y sea 


x= Xt XeH o. EXaln O Y = Pier Hyatt. + rt 
En estas condicionts, 
A(s y) = 
5 Á(UeHxe+ Xen et Jae ++ E Yntn) = 
= Ele, e)= Yours 





donde los coeficientes a: = 4(e,, ex) dependen sólo de la base y no 
dependen de x e y. Por consiguiente, en una base fija una función 
bilineal se representa mediante una forma bilineal,-es decir, me- 
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diante una expresión detipo 2 expe. La matriz A = [04] se 
llama mátriz de esta forma bilineal. E Pi 
escalar (x, y) se representa mediante la forma bilinea! 
S EnxDk, donde gu = (en ex). 

sr 

Veamos cómo varía la matriz de una forma bilineal al cambiar la 
base. Supongamos que en la base es, €, -.., €n 

Alo, y) = Y auxgx» donde am = Alen e), 


y sea ej, €z, ..., e, una base nueva en la que 

AX) = E DaY donde by = Alé, es). 
Tomemos A = [an] y B= [bu] y sea C = [cu] la matriz del 
cambio de la base antigua por la nueva; en estas condiciones, se 
tiene 


5 = Opertoyert.. Capas 
e = Cita t.. +hCngén 
Y Dgo = Ale, ep) = 
= AlCrper+Captat. - « HEnpOn, CigertCaglat o > -FCngen) = 
= A CCrg Ale, ex) = A CipCralm = Y, CipOiCrg > 
Indicando cip por dpi, obtenemos 
Dar = Y, piano 
La matriz C' = [dpi] es la traspuesta de la matriz C = [cy]. 
Además, puesto que E AiCxg es el elemento que figura en la 
i-ésima fila y en la g-ésima columna de la matriz AC, resulta que 
q Praacra = Y, des (2 aucro) 
es el elemento que figura en la p-ésima fila y en la g-ésima columna 
de la matriz C'(AC) = C'AC. Por consiguiente, 
B=CAC. 
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Observemos que la matriz del cambio C (y también la matriz 
C') es no degenerada (es decir, su rango es n); luego el rango de la 
'matriz B es igual al rango. de la matriz A (véase el $ 6 del capítulo 
II. Por consiguiente, el rango de la matriz de una forma bilineal 
no depende de la selección de la base y, por ello, puede ser denomi- 
nado rango de la forma bilineal. 

Una función bilinea! A(x, y) se llama simétrica si 

A(x, y) = A, x) 
para todos los x e y de R. En este caso se tiene ay = 4%, , es decir, 
la matriz [a,x) de lá forma bilincal correspondiente es simétrica (en 
cualquier base). El producto escalar es un ejemplo de una función 
bilineal simétrica. Este ejemplo es de carácter general ya que, recí- 
procamente, toda función bilineal simétrica A(x, y) satisface, 
obviamente, a las condiciones 1, 2 y 3 del$ 1 del capítulo IV y, por 
consiguiente, puede ser considerada como un producto escalar. 

Si en una forma bilineal simétrica A(x, y) se toma y = x, se 
obtiene una forma cuadrática A(x, x). La forma cuadrática deter- 
mina univocamente a la forma bilineal simétrica que la genera. 
Efectivamente, sea A(y, x) = A(x, y) para todos los x e y; entonces, 


A(x+y, x+9) = A(x, x)+24(x, y)+A(», y), 
de donde 

Alx y) = 3 [A(0+y, xy) A(% 0940» y). 

Una función bilineal A(x, y) se llama antisimétrica si 

Ax, y) = AQ», x) 
para todos los x, y € R, En una base fija, una función antisimétrica 
se representa por una forma antisimétrica 


a 
y xo 
tokar 





A y) 


donde, como es fácil ver, az = — aw, para todos los ¡ y k y, en parti- 
cular, ay = 0 para todos los i. Así en el espacio de tres dimensiones 
la expresión de una forma antisimétrica es 

aya — xy d+ BAS XD EY a) 


Sea A(x, y) una función bilineal cualquiera. Es obvio que 
B(x, y) = A(x, y) + 4(y, x) es entonces una función simétrica mien- 
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Pisa que C(x, y) = A(x, y) AG, x) es una función antisimétrica. 
ro 


A(x, y) =4 [805 9)+C(%, 9315 


por consiguiente, toda función bilineal puede ser representada como 
la suma de una función simétrica y una función antisimétrica. 


5 3. Reducción de una forma cuadrática a la suma de 
cuadrados 

Teorema 1. Sea A(x, x) una función cuadrática cualquiera en un 
espacio vectorial de n dimensiones. Existe entonces una base en la 
que esta forma se reduce a la suma de cuadrados (es decir, una base 
en la que todos los coeficientes de los productos de las coordenadas 
distintas del vector x.son iguales a cero). 

Emplearemos para.la demostración la inducción según el 
número de variables que contiene la forma. Si en A(x, x) figura una 
coordenada solamente, se tiene 

A(x, x) = ad 
y nuestra afirmación es evidente. Supongámosla válida para todas 
las-formas cuadráticas que dependen de m—1 coordenadas y con» 
sideremos, una forma cuadrática 

A(%, x) = ay P4209XX%9 +09 A > + On 
que depende. de m coordenadas. 

Si existe aquí al menos un cuadrado con coeficiente diferente de 
cero, por ejemplo, si Amm »* O, agrupamos todos los términos que 
contienen Xm 

Ly XxX + 209 XX E >» + +28, m Xm=1%m + mm 
y «despejamos el cuadrado perfecto»: 

LX + Lago > «EL, m Ximo PO, = 


t 
E MN 
1 
7 mtm +. +Oma, m Xin-1). 
Tendremos entonces 
1 
AG, x) = 7 ink Hama > FOX + B(x, x), 
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donde la forma cuadrática B(x, x) contiene solamente m-—1 coorde- 
nadas X1, X2, «.-» Xm—1- Pongamos 

Yi MY = Kar +++, md = Xt 

Im = GimXihOomX2 4 > + Gm Xy 


Ym+1 E mado ++ ++ Y 





Puesto que el determinante 
LI 6 Ds Dina 





la introducción de estas nuevas coordenadas corresponde a un 
cambio de base (con la matriz del cambio iguala la inversa de la 
matriz del determinante (1). 

Según la hipótesis de inducción, la forma B(x, x) que depende 
dem—1 variables X1, Xa, » - ., Xm-1 Puede serredincida, mediante:un 
cambio de base, a la suma de cuadrados. Con esto quedará también 
reducida a la suma de cuadrados la forma A(x, x). 

Hemos supuesto que al menos uño de los cuadrados de la forma 
A(x, x) tiene el coeficiente no nulo. Si esto no tiene lugar, es decir, 
si todos los ay = 0, aceptemos, por ejemplo, que á12 + 0 y pon- 
gamos 





esto corresponde al cambio de base 


e = e4es 
e = 0 —tp 
es 
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con la matriz del cambio 
1 E O sz O 





(el determinante de esta matriz es igual a —2 5* 0). El producto 
x,X, se convertirá entonces en »¿—y% y llegaremos al primer caso. 

Hemos demostrado que dada en un espacio vectorial R de n 
dimensiones una forma cuadrática cualquiera, se puede encontrar 
una base de R en la que la forma se reduce a la suma de cuadrados: 


Ax, x) =ax Ha xs a) 
donde xj, xj, ..., X4 Son las coordenadas del vector x en la base 
nueya. Los coeficientes a; pueden ser tanto positivos como negati- 
vos; algunos de estos coeficientes pueden ser iguales a cero. Si rea- 
lizamos, además, la sustitución Y/]a,| xí = 2, obtendremos para 
la forma cuadrática A(x, x) la expresión 

Axx=idi4t...12% 

(donde el coeficiente de cada una de las variables nuevas 21, 
Za, -.., Zn es igual o biena +10 bien a —1) o, alterando la numera- 
ción de los vectores básicos, la expresión 

Ax) = AH AA e 





Ejemplo 1. Redúzcase a la suma de cuadrados la forma cuadrática 
AL+ 2x1 Xp + 3x3 + 4x,%9 + Óx,X + 5x3. 
Solución. 
AE, 1) = (Ax A A 
(44204 (443 


$ 4. Ley de inercia de las formas cuadráticas 


Reduciendo de diferentes modos una forma cuadrática A(x, x) 
a la suma de cuadrados, obtendremos en la fórmula (2) diferentes 
coeficientes. Sin embargo, tiene lugar el siguiente hecho importante: 
Teorema 2 (ley de inercia de las formas cuadráticas). Si una 
forma cuadrática se reduce a la suma de cuadrados en dos bases 
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diferentes, el número de los cuadrados positivos, así como el número 
de los cuadrados negativos, es el mismo en ambos casos. 
Demostración (por reducción al absurdo). Supongamos que 
la forma cuadrática Á(x, x) tiene en una base er, €2, ..., €n la 
expresión 
Ax) = de A -—eo (0) 


donde x, son las coordenadas del vector x en esta base, y que en 
otra base ej, é2, ..., €. 


AX) SA EX 0 + — Memo 10) 


donde xí son las coordenadas del vector x en la base nueva. Sea, 
por ejemplo, p > k. Consideremos en el espacio R el subespacio Ri 
generado por los vectores €, €2, . . ., € y el subespacio Ra generado 
por los vectores eí+r Ch+m - Puesto que la suma de sus 
dimensiones, igual a p+(1—k), es mayor que n, resulta que la 
intersección de estos subespacios es de dimensión no nula (teorema 5 
del $ 6 del capítulo II), es decir, existe un vector x 54 O que perte- 
paid Ri NM Ra. Este vector puede ser representado tanto en la 
forma 


x =ajeHogent... Pape 

















como en la forma 

x= Berti trasto Hb 
Para el vector x tenemos según la fórmula (3) 

Ax,x) =a +34... +ab> 0 
ya que al menos uno a, 0; al mismo tiempo según la fórmula (4) 

A) Bl Bla +++ Pym 0 
(aquí la desigualdad no es estricta porque k-+m puede ser menor 
que »). 

Hemos llegado a una contradicción y ello demuestra que debe 
ser p== k. Análogamente se demuestra que no púede tener lugar 
la'desigualdad p < k. Luego, p = k. De la misma forma se de- 
muestra que q =m. 


Es fácil yer que la suma p+q es igual ál rango r de la forma 
cuadrática A(x, Xx). 
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$5. Formas definidas 


- Definición 3. Una forma cuadrática A(x, x) se llama definida 
Positiva (negarioa) si A(x, x) >0 (A(x, x) < 0) pará todo x>* 0 
y se llama semidefinida positiva (negativa) si A(x, x) => O(A(x, x) <= 
<0) para todo x. 
Por ejemplo, si A(x, y) = (%, ») es el producto escalar en un 
espacio euclídeo, la forma cuadrática correspondiente A(x, x) = 
= (x, x) (el cuadrado escalar del vector x) es definida positiva. 

Está claro que toda forma cuadrática definida positiva se 
reduce a la suma de.cuadrados con coeficientes positivos y que toda 
forma semidefinida positiva se reduce a la suma de cuadrados con 
coeficientes no negativos (algunos de estos coeficientes pueden ser 
iguales a cero). Es importante el siguiente criterio de definición 
positiva de una forma. 

Teoréma 3 (criterio de Sylvester). Para que una forma cuadrática 
A(x, x) sea definida positiva es necesario y suficiente que sean posi- 
tivos todos los menores «angulares» de la matriz A = [ax], es decir, 
los menores 41 = ax, 

















do a AS 
d4= ,d=|á2 0 al, =14/. 
pr E dy dea das 
deben ser positivos. 


Para la demostración emplearemos la inducción según el número de 
sabio qos Contiene la forma. 

Para las formas cuadráticas que dependen de una variable se tiene A(x, x) = 
=apx] 1 nuestra afirmaciAn es o! Supongamos que ésta es válida para 
todas las formas cuadréticas que dependen de m-1 variables y consideremos 


una forma cuadrática A(x, x) = É 2axyXs Cn m variables Xy, Xp, +00) La 
pa 


1. Demostración de la necesidad. Si representamos la forma definida positiva 
A(x,x) como 


49,2) = E, date ZE, Gti aaa 





resulta que la forma cuadrática B(X, x) = E amxix. que depende de 
2 


Xm=1, € definida positiva, ya que siendo B(X”, x” «a 
Xa-0 tendríamos Ax, x) 50 para x = (Xp Xy «++ 
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Según la hipótesis de inducción todos los menores angulares de la matriz 
de la forma cuadrática B(x”, x') son positivos, es decir, 
Oi y 


SR 








eN 


Resta demostrar que también 4 = 14]>0. 
Como sabemos, la forma ¿aida posa As x) se reduce en una base 
El, Esp: +, € a la suma de cuadrados: 


AAA es 
El determinante de su matriz.es igual en esta base nueva a 1 y, por consiguiente» 
es mayor que cero. Pero en el cambio de base la matriz de una forma bilincal 
se transforma de acuerdo a la fórmula (pág. 167) 

B= CAC, 


donde A es su matriz en la base antigua, B es su matriz en la base nueva y Ces 
la matriz del cambio de la base antigua por la nueva. Luego, 


18] = CU IALICI=141 ICH. 


Es decir, el signo del determinante de la matriz de una forma bilineal no depende 
de la base; por consiguiente, también en la base antigua tenemos 


1AI=4,>0. 


2. Demostración de la suficiencia. Supongamos que todos los menores 
copia de la matriz de una forma cuadrática A(X, x) son positivos: 


410,4 >0,..,, 410,4 =141>0 


lemostremos que la forma cuadrática A(x, x) es definida positiva. De la 
Tape deducir nt todo, que es definida positiva la forma cua= 


drática B(X,x) = e Anxexy de m-1 variables. Por consiguiente, B(x', x) 
X 
se reduce en una base nueva a la suma de cuadrados 
BS ARA 
Realizándo el cambio correspondiente de las variables xj Xy... 





(m1 Y toman- 
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do, además, X= Xi Obtenemos 


A 
E 
donde b,,, son unos coeficientes nuevos. Tenemos entonces 
A E A A 
donde, obviamente, b=an—bl=bja=...— bh m Y tomando 


Xian = Yo Ka = Y 


o que corresponde a un cambio de base, siendo el determinante de la matriz 
del cambio igual a la unidad), obtenemos 


E a 

El determinante de la matriz de esta forma cuadrática es igual a b y como 
su signo, por lo demostrado en el punto 1, coincide con el signo de 4,,, resulta 
que b > 0 y, por consiguiente la forma cuadrática A(x, x) es definida positiva. 
Hemos demostrado el teorema. 

Es fácil indicar ahora las condiciones de definición negativa de 
una forma cuadrática A(x, x)= Y anxixi. Para que una forma 


kml 
cuadrática A(x, x) sea definida negativa es necesario y suficiente 
que la forma cuadrática 


Ax) = Y (0)x1%x 
1 


ko 


sea definida positiva; luego, todos los menores angulares de la 
matriz 


4 —% 
ta Gr 


01% 
—O%a 
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deben ser positivos. Pero esto significa que 
4=44=0, de= 





ay ds 0 
4 


0... 


Ur Ga da 
M3 da 0 
es decir, que se alteran los signos de los menores angulares de la 
matriz A, siendo de signo menos el primero. 

Ejemplo 2. Al extremar la función 

FG, y, 2) = 2x4 y i4 112% 2ay + 4x2 622) 487, (0) 

obtenemos que sus derivadas parciales se anulan para 

x=1,y=2y2=0 








La segunda diferencial toma la forma 
«BF == U2dx?-2dx dy +dy*+4 dx d:-6 dy dz+11 de). 


En los paréntesis figura una forma cuadrática respecto a las diferenciales dx, 
dy y dz de las variables ¡ndependientes. Los menores angulares de su matriz 


2 2-1 2 
PA EE 
2-3 14 








son positivos. Por consiguiente, esta forma cuadrálica es definida positiva y 
la función (5) tiene mínimo en el punto (1, 2, 0), 


$ 6. Formas bilineales y cuadráticas en un espacio euclídeo 


Lema. Sea R un espacio euclideo y sea C = [cu] la matriz del 
cambio de una base ortonormal e,, €, ... .. en por otra base, también 
ortonormal, es, €%, « . ., €. Entonces C es una matriz ortogonal. 

Demostración. Por hipótesis, 


ej =Cuer+enet Fent 1=1,2 ...,.M 


Consideremos la aplicación lineal € de matriz C en la base es, 
Cñ, ...3 £n Tenemos 


le, = cuertenert..Hlntn =éj, 21,2, ,..,M 
Pero toda aplicación € -que transforma al menos una base orto- 
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normal en una base:ortonormal es ortogonal (véase el$ 3 del capí- 
tulo Y). Por consiguiente, C es-una matriz ortogonal, 

Sea ahora es, €2, ..., en una base ortonormal de un espacio 
euclídeo R y sea A(x, y) una función bilineal que se representa en 
esta base por la forma bilineal 


a 
Ax) = Y aux 
hh 
donde x= xj01+xe2+...bXntén € Y = YrerHyatat.-- + Ynéno 
Consideremos la aplicación lineal ot de esta misma matriz A en esta 
misma base ey, €s, . . ., €x. Si Ces la matriz del cambio de esta base 
por una base nueva e;, es, ..., €, la matriz A de la forma bilineal 
se convierte en 


=C'AC 
y la matriz de la aplicación lineal ot se convierte en 
Cc-1AC, 


es decir, estas matrices se transforman, en general, de modo distinto. 
Sin embargo, si la base nueva ej, €z, ..., €, también es ortonormal, 
la matriz del cambio C es ortogonal y se tiene C' = C”1, En este 
caso la matriz de la forma bilineal A(x, y) y la matriz de la aplica- 
ción lineal cé se transforman del mismo modo. Por consiguiente, 
en un espacio euclídeo a toda función bilineal le corresponde una 
aplicación lineal completamente definida (que tiene la misma matriz 
en cualquier base ortonormal). 

Si A(x, y) es una función simétrica bilineal, la aplicación lineal 
correspondiente ct será autoconjugada. Pero la matriz de toda 
aplicación autoconjugada tiene, en una base ortonormal determi- 
nada, la forma diagonal 





La forma bilineal A(x, y) se reduce en esta misma base a la 
forma 


AAA AA +A 
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(donde los coeficientes A, son: los valores propios de la aplicación 
lineal A) y la forma cuadrática correspondiente A(x, x) se reduce 
a la suma de cuadrados 

AAA AA 

Ejemplo 3. Redúzcase la forma cuadrática 

Alx, 1) = 66x*-24xy+39y* 
sd espacio euclideo R* a la suma de cuadrados mediante una aplicación orto- 


Solución. El polinomio característico de la matriz de esta forma es 

$6-A 12 
=1l1 9-1 
Sus rafoes som dy =75 y Ay = 50. 


En la base nueva (formada por los vectores propios correspondientes a los 
valores propios 4, y Ay) se tiene 


Alex) = TS +50)". 


= 11125443750. 


CAPÍTULO VII 


ESTUDIO DE CURVAS Y -DE SUPERFICIES DE 
SEGUNDO GRADO 


En los tres primeros parágrafos de este capatuzo se consiaera el 
espació euclídeo de «dos dimensiones (el plano) con la métrica 
corriente (euclídea). En el último parágrafo se considera el espacio 
euclídeo de tres dimensiones. 


$ 1. Reducción de la cnc general de una curva de 
segundo grado a la forma mica 


Tomemos en el plano un sistema cartesiano rectangular de coorde- 
nadas y consideremos la ecuación general de segundo grado 


SY) = 004209) +0? + 2x4 2aay+a = 0. Mm 
Como se sabe, para algunos valores determinados de los coeficien- 


tes esta ecuación representa una elipse Ez = » una hipér- 
bola (5-7 = 1) o una parábola(y* = 2px). Demostraremos que 
la ecuación (1) es siempre la ecuación de una de estas curvas: 
de una elipse, de una hipérbola o de una parábola (sin contar los 
casos degenerados, es decir, los casos de un par de rectas —que se 
da si el primer miembro de la ecuación se descompone en el pro- 
ducto de dos factores lineales—, de uh punto o de un «conjunto 
vacio» que no contiene punto alguno). 

Indiquemos por ex y es los vectores unitarios de los ejes del 
sistema (rectangular) de coordenadas escogido. El grupo de los 
términos principales 

004 2a xy + amy? a 
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de la ecuación (1) puede ser considerado como una forma:cuadrá- 
tica de las coordenadas x e y del vector (x, »). Según hemos de- 
mostrado en el $ 6 del capítulo VÍ, esta forma cuadrática se reduce 
en una base e, e; (también ortonormal) a la suma de cuadrados. 


AH, 0 
donde 2, y 22 son los valores propios de la matriz 
dm [E Ay 4) 
12 da, 


y es y es son los vectores propios que les corresponden. 

Supongamos que el vector e; se obtiene del vector e, mediante 
un giro de ángulo p.en el sentido opuesto al del movimiento de las 
manecillas de un reloj. Puesto que €l vector ez es ortogonal a ex 
y el vector e;-es ortogonal a.e;, resulta que el vector ez se.obtiene 
del vector es o bien mediante un giro de ángulo p o bien mediante 
un giro de ángulo y seguido de la simetría respecto al origen de 
coordenadas. En el segundo caso sustituiremos ea por el vector 
es, = —ef que también será un vector propio de la matriz (4) 
correspondiente al mismo valor propio 22 ya quesiendo ote; = Aye 
se tiene 

Aj = Ae) des =—hgi = des 
Por consiguiente, se puede aceptar que la base nueva ej, ez se 
obtiene de la antigua mediante un giro de ángulo q en el sentido 
opuesto al del movimiento de las manecillas de un reloj, es decir, 
que 

ej = COS p»e,+sen p-es 

€, =-—Sen p-e,+008 P-eg. 





Pero en estascondicioneslas coordenadas antiguas xe y (de un vec- 
tor y, por ello, también del punto correspondiente) y las coorde- 
nadas nuevas x' e y' estarán ligadas por Jas. relaciones 


cos p-x'=sen py, 
y = sen p-x'4C0s p-y'. 


Introduciendo las expresiones-(5) en la ecuación (1), reduciremos 
esta ecuación a la forma 


IN Hd +20 +2 +b = 0, (6) 





6) 
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donde bi, ba y b.son unos coeficientes nuevos. Esta 'operación 
lleva el nombre de referencia de la curva a los ejes principales: en lo 
sucesivo veremos que, si la curva (1) representa una elipse o una 
hipérbola, los nuevos ejes de coordenadas son paralelos a los ejes 
principales de la curva. 

Los coeficientes 41 y 22 son los valores propios de la matriz (4) 
y pueden ser determinados de la ecuación 


y = (m 





du-A de | a 
Mm mA 

Estos valores son reales, pues la matriz (4) es simétrica (teorema II 
del capítulo V). El poten 212 de los valores propios es igual al 
término independiente p(0) de la ecuación de segundo grado (7) es 
decir, coincide con el determinante 

Qu 
da 


$= 








Consideremos ahora por separado dos casos dx 0 y 6 =0. 
Lós 2450. 
Transformemos la ecuación (6) del modo siguiente 


h A =0, 
donde e =b—¿1-—22. Realicemos la sustitución 
xa + yo. y+z 
Esto a al traslado del origen de coordenadas al punto 


(a - 2) con la particularidad de que se conservan las direc- 
ciones de les ejes. La ecuación (6) se reduce entonces a la forma 


ATA te =0. (8) 
Supongamos primero que 4122 > 0 (es decir, que 3 > 0), En 


este caso el lugar geométrico de los puntos cuyas coordenadas 
satisfacen a la ecuación (8) es una elipse (fig. 13, a) si e y A, son de 
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Fig. 13 


signos opuestos, se reduce a un punto si c =0 y no contiene punto 
alguno si c y 21 son del mismo signo”. 

Sea ahora 1142 < O (es decir, ó < 0); en este caso (8) es la ecua- 
ción de una hipérbola si c * O (ig. 13, b) y de dos rectas que se 
cortan sic =0, 

En el caso I la línea es una curva de segundo grado con centro 
(es fácil ver que el origen de coordenadas es para la curva (8) el 
centro de simetría). 

IL. 8 = 412e = 0 y sea, por ejemplo, 22 * O. La ecuación (1) 
se reduce a 


day" +2b1x+2byy+b =0. (9) 
Si b + 0, tendremos formando el cuadrado perfecto 


bye CAC 
A E 
Trasladando el origen de coordenadas 


€. 


» En lugar del «punto» determinado por la ecuación. adi 
se habla también del par de«rectasimaginarias» y"=+1 Lx” que se cor- 


Er 
an en un punto teal (es decir, en un ppnto Corriente que existe realmente). 
El «conjunto vacio» de puntos A1x”*+2,y"*+c = 0, donde A, 4, y-€ son del 
snino dr Mama cl esfpas imegicari. 
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170 





Fig. 14 
reduciremos la ecuación (9) a la forma 
2 "+2b1x" =0. (10) 


Está es la ecuación canónica de una parábola (fig. 14). 
En el caso.en el que b, =0, la ecuación (9) se réduce a la forma 


oy) soto 
que mediante la sustitución 
ex y=y+h 
se convierte en 
y + e =0. (1 


Esta ecuación representa dos rectas paralelas si cda < 0, dos rectas 
confundidas si e =0 y un «conjunto vacio de puntos» (que no 
contiene punto alguno) si cAq > 0%, 


$5 2, Invariantes de una curva de segundo grado 
Se llama invariante de una curva a toda expresión formada por 


los coctcientes dí ol enoción qe ne corto al cont ln 2 
cartesiano rectangular de coordenadas por otro sistema del mismo 


A 0, donde 4, > 0, determina 
un «par de rectas paralelas imaginarias». 
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tipo, es decir, que no varía al realizar rotaciones y traslaciones parale- 
las de los ejes de coordenadas. 


Teorema 1. Son invariantes de una curva de segundo orden (1) 
la suma de los coeficientes de los cuadrados de las coordenadas 


$ = A +An, 


el determinante formado por los coeficientes de los términos princi- 
pales 


du 
dy 0 


$ 





y el determinante del tercer orden 
Au da 
Ma da 0 
a 44 

Demostración. Consideremos por separado los casos de tras- 
lación del origen de coordenadas y de rotación de los ejes coordena- 
dos. Supongamos primero que el origen de coordenadas se traslada 
a un punto de coordenadas («, $) (conservándose las direcciones de 
los ejes). Tenemos entonces 


x=x+x 

y=y+b, 
donde x' e y' son las coordenadas nuevas. Introduciendo estas 
expresiones de x y de y en la ecuación (1) obtenemos 


aye +42 +2) (+8) +02 +8 + 
+2a(x'+2)+204(y'+ B)+4 a = 0, 


de 








es decir, 
ax +2a y +00" + Hana + 8 +05) Y + aso + am + 
+a)y +(010?+ 209084094201 0+ 2029844) = 0. (12) 
Vemos, pues, que el grupo de los términos principales no há 
cambiado y, por:ello, es evidente que s Y $ son unos invariantes. 
Observemos que el cocficiente de x” es igual a Lana +01984+a1) = 


=f¿(a, $) es decir, al valor de la derivada parcial del primer término 
de la ecuación (1) respecto a x calculado para:x =x e y.= B; el 
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coeficiente de y' es igual a f;(x, B) y el término independiente es 
igual a f(«, f); por consiguiente, la ecuación transformada 
toma la forma definitiva 

ax +2 y + a" + (a Box +45 (a, By + (00, B) = 0, 


donde f(x, y) es el polinomio que figura en el primer miembro de 
la ecuación de la curva. 
Para la ecuación (12) el determinante 4 esigual a 


Qu 4 aya+aP+ as 
Ars pS Aya+amB + de . 
aye+aB+a, ar+amf+a aua*+2a208+ a P*+ 201042098 + a 

Restando de la última fila de este determinante la primera 

multiplicada por a y la segunda multiplicada por $, obtenemos 

du Gn aya+ayB+a 
dy as Aya+amf+as|. 
a 4% aatabra 


Realizando estas mismas operaciones con las columnas del deter- 
minante obtenido, encontraremos que es igual a 
da Gs a 
dí da dl, 
4 4 4 
es decir, coincide con el determinante antiguo 4. Por consiguiente, 
hemos demostrado también que 4 es un invariante respecto a las 
traslaciones del origen de coordenadas. 
En el caso de una rotación de los ejes coordenados de ángulo p 
la matriz del cambio de la base antigua por la nueva 

cosp —senp ] 
snp  cosp 














es ortogonal; por consiguiente, la matriz de la forma cuadrática 
anx?42axy + amy? 


se transforma igual que la matriz de la aplicación lineal correspon- 
diente ($ 6 del capítulo VI). Pero en el caso de una aplicación lineal 
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de matriz 
Ay 

poe 
los coeficientes de su polinomio característico 

ol A 
A aa 

= M(411 +09) 440109 —ade = 95140 
no dependen de la selección de la base (teorema 6 del $ 7 del capí- 
tulo 1T). Con esto queda demostrada la invariancia de s y de 5 en 


las rotaciones de los ejes coordenados. Análogamente se puede 
demostrar que también el determinante 4 es un invariante. 








En efecto, si tomamos una base nueva tal que 
el = cos p-e+Sen 9-eg 
Em sen p-e1+003 pee 
las fórmulas de transformación de coordenadas serán 
x= cos p-x—sen py, 
y = sen p-x+c0s py. 
Consideremos una forma cuadrática de tres variables 
F(x,y,2) = ayx*+20,2xy+09y*420,x2420,y2+a2* 


en una base ortonormal e,, e;, e, del espacio euclídeo de tres dimensiones R*. 
Para z = 1 esta forma coincide con f(x, y). Si realizamos un cambio ortogonal 
de matriz 


cosp —sap 0 
[> pon o] 
o 0 1 


de la base €;, €, y £s, tendremos las siguientes fórmulas de transformación de las 
coordenadas de R* 


x= cospr—senpy, + 
y =senp-x+cos p-y, (14) 
2=r. 
Si fx, y) se transforma mediante la sustitución (13) en 
AY Hb” 42 +2 +0, 

está claro que Fx, y, 2)se transforma mediante la sustitución (14) en 
E AY Hi ADT ALT 4 az 


do] 
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El determinante.de la matriz de una forma cuadrática no varía al réalizar un 
cambio ortogonal de la bass; por consiguiente, para la forma F(x, y, ).tieno 
lugar la igualdad 

bn be br ly O 
En bm bi = [diz Om Gr|- 
b boa 4 40 


Pero su primer miembro e el determinante 4 par (+) e la base nueva 

ei es y su segundo miembro es el mismo determinanic en la base antigua. Por 

Sónslguente, ete determinante tampoco varía en las rotaciones de los ejes 
rdenados. Hemos demostrado completamente el teorema. 


ter 3 permite juzgar sobre el tipo de la curva: si ó > 0, 
tenemos una curva de tipo elíprico (una elipse, un punto o «un 
conjunto vacío», es decir, una «elipse imaginaria»); si 9 < 0, tene- 
mos una curva de tipo hiperbólico (una hipérbola o dos rectas 
reales que se cortan); si  =.0, tenemos una curva de tipo parabólico 
(una parábola o dos rectas paralelas que, posiblemente, se confun- 
den o incluso no existen, es decir, son «imaginarias»). 

La invariancia de las expresiones s, d y Á, establecida en el teo- 
rema 1, facilita la reducción de la ecuación de la curva a la forma 
canónica. Así, por ejemplo, en el caso de una curva central, es 
decir, para ó ¿* O, una vez determinados los valores A; y Aa, la 
ecuación de la curva se reduce, como hemos visto, a la forma 

A+ e =0, 

Para esta ecuación tenemos 

4 00 

4=|0 % 0|=A%e, 

00c 


de donde resulta 2420 = 4o de = 4, esdecir,c =$. Por consi- 


guiente, la ecuación «canónica», es decir, simplificada, de una 
Curva central de segundo grado es 


AA+ 0. 

Si 

5>0 y 40, 
Nuestra curva es e elipse o una «elipse imaginaria». sn Una 
elipse (real) si 21 y Fson de signos opuestos, es decir, sit 7-0; 
pero como Ú > 0 y 21 es del mismo signo que s, esto ocurrirá si 
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5 4 <0, La curva será una «elipse imaginaria» en el caso en el que 
s A = 0. Finalmente; si d > Oy 4 =0,la curva és un punto. * 

Si $ < 0, la curva representa una hipérbola pará A % 0 y se 
descompone en dos recías que se cortán pára A = 0. 

Para una parábola cuya ecuación ha sido reducida a la forma 
(10), se tiene 





o 0 by 
4=|0 2%  0j=-biá, 
br 0 0; 


Aquí b1 * O y, por consiguiente, 4 > 0. 
En el caso de dos rectas paralelas (distintas, confundidas 
o «imaginarias») la ecuación de la curva se reducé a la forma 


MY 0 =0. 
En este caso se tiene 
0.00 
4=|0 % 0|=0. 
0.0 < 


Resumamos los resultados de los dos últimos parágrafos en el 
cuadro siguiente: 














sd <0. Elipse 





5>0 


Curva de tipo 
| elíptico 


54 > 0. «Elipse imaginario» 










Punto (o dos «rectas imaginarias» 
que se.cortan en este punto) 

















$<0 Hipérbola 
; 
pt Dos rectas que se cortan 


Parábola 













5-0 
Curva de tipo Dos sectas paralelas (distintas, con- 
parabólico fundidas o «imaginarias») 
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De este cuadro se ve, en particular, que el determinante 4 es igual 
4 cero si, y sólo si, la curva se descompone en dos rectas (reales 
o «imaginarias»). Por consiguiente, el determinante Á permite decir 
si la curva se descompone o no se descompone en dos rectas, sin que. 
sea necesario reducir la ecuación de la curva a la forma canónica. 

Ejemplos. Determínese el tipo de las curvás siguientes y redízcase lá ecua- 
ción de éstas a la forma canónica. 

1. 3x2 +3) "4214941 = 0; 

2, 3x1 2xy+3y"4+2x—4y+2 = 0; 

yal =0; 

4.x04+2xy-y"-6x+4y-3  =0; 

5.x14 31942) *42x4+5y-3 y 

6.x1-2xy+y!+4x—6y+1 

7. x54Axy dy! 2 4y-3 = 0; 

8. x*44xy+4y*-2x4y+1 0; 

9. xt+ day dy? 244942 20, 

Solución. 


3 -1 
13=|_ ¿[uso 








Tenemos una curva de tipo elíptico. Puesto que 
3-1 1 
-=1 3-2 
E 
la curva no se descompone. 
Tenemos, además, 


3-4 A 
“0 | al ra emo, 


A=341, A4=4 4=2 
La ecuación canónica de la curva es 


4 =-30, 








16 
ata h=0 ó AA 





La curva es una elipse; sus semiejes son 


vi Y3 
=03 y b=- LÚoos 
3% y 7% 


3-1 
103 


a= 








[-3=0. 
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La curva es de tipo elíptico. 
| 32101 
del 3 -2[=5%0 
| tz a 
La curva no se 


descompone. 
Además, s =6, 5=8 y p(A) = 25-64+8; A =4y 42 = 2, La ecuación 
canónica de la curva es 


ar m0. 
Tenemos una elipse imaginaria» (un «conjunto vacio» de puntos). 
10 
3.8=|, y[=1>0 


La curva es de tipo elíptico. 





Esta curva, cuya ecuación puede ser representada en la forma 
CI) O, 
representa un punto 
2=-tey=0 
y puede ser interpretada como dos rotas «imaginarias» quese cortan en este 
punto: 


x+iy+1=0 y x-iy+1=0, 





La curva es de tipo hiperbólico. 
1-3 
1.2 
2-3 
La curva no se descompone. 


Además, s = 0,8 =-234(1) = 192,2 = V2y 2 =-vV2, La ecuación 
canónica de la curva es 


Vi Vi m0 


=-1%0, 








241y*-241x"=1. 
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La curva es una hipérbola; sus semiejes son: a = 5 ss 0,6. 


8 
E 1 
58=|, y =-<0. 
z 
La curva es de tipo hiperbólico. 


La curya se descompone en dos rectas que se cortan. Por consiguient 
ip y er 
Para determinar 


estos factores se puede proceder del modo siguiente. Resolva- 
mos la ecuación 


Aly y 3 = 94 (3942) 142914593 = 0 


rospestoa x (el primer miembro dela ecuación se descompone, como sabemos, 
lineales; luego, x so expresa racionalmente mediante y); 


(rl Pra +3 > 


=-y-3 a =-2y+l 


Por consiguiente, el primer miembro de la ecuación se descompone en los 
bno) siguientes: (x4-y+3) (x+2y=1) = 0 y la curva se descompone en dos 





Ra y x+2y-1=0 
1-1 
6.8=|_; ¿[o 


La curva es de tipo parabólico. 

1 - 

1 1 

2-3 1 

La curva no se descompone. Además, s =2, 3=0 y (A) = 4'-24, 2, =0, 
1 


2 =2,0 =24/ 7. La ecuación canónica dela cuna es 


YiVIX=0 6 y =2: 


da 1,0. 














al 
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“Tenemos una parábola. 
12 
70m = 
0- ¿oo 
La curva es de tipo parabólico. 
1 2-1 
4d=| 2 4 -2|=0. 
-l -2 -3 








La curva se descompone en dos rectas paralelas 
x+2)+1=0 y x+2y-3=0. 
12 


8.ó= 2 ¿jo 


La curva es.de tipo parabólico. 


A 2- 
2 4 -21=0 
1-2 1 


4 





y la curva se descompone en dos rectas. confundidas 
$0 y) = (+2y-1D* =0,x+2y-1 =0. 


9.50!) z 
24 


La curva es de tipo parabólico. 
pp21 
242 
122 
y la curva representa un «conjunto vacio» de puntos, es decir, se descompone en 
dos «rectas imaginarias» paralelas: 
1069) =0+YADAL AS (2 (4 2y 41d) = O 


=0, 





dn =0 








$ 3. Determinación del centro y de los ejes principales de 
una curva con centro, Determinación del vértice y del eje 
de una parábola 


En este parágrafo aceptamos que Á 5 0, es'decir, que la curva 
no se descompone en dos rectas» 

Supongamos dada una ecuación general de segundo grado (1). 
Determinemos los valores propios 41 y 2e de la matriz (4) y los 
Vectores propios e; y ez correspondientes. Sabemos que en la base 
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compuesta de estos vectores la forma cuadrática ay + 


Hany? se reduce a la suma de cuadrados 2x”+22y” y que la 
ecuación (1) se reduce a la forma (6). Como sabemos, los vectores 
propios e; y e de la matriz (4) se determinan de los sistemas de 
ecuaciones 


[ Ar = 21%, E ( AgXa+ Or2 Ya = 2x2, 
ax tamy AyoX2 + amya = Jay; 
puesto que el determinante 

pr ema 
a a2—A 





es igual a cero, ambos sistemas se reducen a una ecuación: 
(a1—2)x1+a1291 = 0 en el caso del primer sistema, 
(11 —2a)xa-+ Gray, = O en el caso del segundo sistema. 
Por consiguiente, para ej = (x,, y,) tenemos 


Ye 4 
x a 


y para ez = (xa, Ja) tenemos 





Luego, los coeficientes angulares de los nuevos ejes de coorde- 
nadas en el sistema antiguo son iguales a 


tu 
ES 








(para el nuevo eje x que corresponde a 41) 


la= ta (para el muevo eje y que corresponde a 2). 


Para na la ecuación de la curva a la forma canónica basta, 
como hemos visto, realizar a continuación una traslación del origen 
de coordenadas; por consiguiente, los valores k, y ka determinan las 
direcciones de los ejes principales de la curva (1). 

Supongamos que la curva considerada de segundo grado tiene 
centro, es decir, aceptemos que ó * 0. Para determinar el centro 
de la curva, es decir, el origen del nuevo sistema de coordenadas, 
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nos basaremos en el siguiente razonamiento elemental. Si traslada- 
mos el origen de coordenadas al punto (a, $) sin alterar las direocio- 
nes de los ejes, esto es, si tomamos 

x=x4a0, 

y=Y+B, 
la ecuación (1), como hemos visto, se transforma en 


a Ha y + HF (a, Br + 
+f(a, By +, B) =0. 


Consideremos el sistema de ecuaciones 


Li 9) = aux +ay+a; =0, 
(15) 


FLY) = Mart 0my +02 = 0. 


Puesto que su determinante Ú es, por hipótesis, diferente de 
cero, el sistema tiene una solución (única) a, f. Si trasladamos el 
origen de coordenadas al punto (a, $), en la ecuación desaparecerán 
los términos de primer grado en x' e y” y, por consiguiente, el origen 
nuevo de coordenadas será el centro de la curva. Luego, el centro 
de una curva de segundo grado con centro (de una elipse o de una 
hipérbola) se determina del sistema de ecuaciones (15). 

Consideremos ahora una curva de segundo grado sin centro 
(es decir, sea d = 0). Esta es una parábola, pues hemos aceptado que 
45 0. Sean 41 =0 y 22 los valores propios de la matriz (4); las 
direcciones de los ejes nuevos se determinan jgual que antes 


ki=% 
y 
ka = 22 (para el eje Oy! que corresponde a 4). 


El nuevo origen de coordenadas, es decir, el vértice («, B) de la 
parábola, puede ser determinado con el razonamiento siguiente. 
Para la parábola dada mediante la ecuación canónica y? = 2px, el 
eje Oy es la tangente en el vértice. El nuevo eje Oy tiene en los ejes 


coordenados antiguos el coeficiente angular igual a ka = CN 





=% 2 (para el eje Ox' que corresponde a 21) 
lr % 
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Puesto que coincide con la tangente a la parábola en el vértice 
(a, B), el coeficiente ka debe ser igual a la denvada y? en este punto. 
Para determinar y, derivemos respecto a x la ecuación (1) consi- 
derando que y es una función de x; obtenemos 
Feos YA PY = 0, 
de donde 
pr LAY) 
di LY 
Es decir, en el vértice (a, 8) se tiene 
kaos Eb 
fia. p)? 








de donde 

Fale, B)+kafy(a, B) =0. 

Por consiguiente, las coordenadas del vértice (u, B) de una pará- 
bola se pueden determinar resolviendo el sistema de ecuaciones for- 
mado por la ecuación 

Fils YH aL (%, y) =0 (16) 
y la ecuación (1). 

“Veamos el sentido geométrico de la ecuación (16) que puede ser 
representada detalladamente en la forma 

(aux+ay+ 01) + kdax+ any +02) = 0. 


Esta es la ecuación de una recta que pertenece al haz determi- 
nado por las rectas 

GXx+ayy+a =0 y ayx+amy+a =0. 
Los coeficientes angulares — 4! y —G2 de estas rectas coinciden 

'. 

por ser 3 = 0 y son iguales a k1; luego, estas rectas son paralelas al 
nuevo eje Ox. Por consiguiente, también la recta (16), que pertenece 
al haz que ellas determinan, es paralela al nuevo eje Ox. Como, 
además, esta recta pasa por el vértice, es el eje de simetría de la 
parábola, es decir, su diámetro principal. 

Ejemplos. Determínense los nuevos sistemas de coordenadas y constráyanse 
las gráficas de las curvas 1, 4 y 6 del parágrafo anterior. 

Solución. 

1 3xt-2ay+3y"42x4y+1=0,2=4,2.=2. 
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Las direcciones de los ejes nuevos son 


PE 





(eje Ox), 





(eje Oy). 





El nuevo origen de coordenadas (cl centro de la curva) se determina del sistema 
de ecuaciones 


3x- y+l=0, 
-x+3y-2=0, 


+ « La ecuación del eje Ox' (en el sistema antiguo 





de donde x ==, y 


de coordenadas) es 








y la ecuación del eje Oy' es 
5 1 3 
ra da 
En la fig. 15 se representa la gráfica de la curva. 
4.x042xy-yi—6x+dy-3 =0,4 =V2, 4 =-Y2 
Las direcciones de los ejes nuevos son 


hn Bar on, 


ka =-(V241) (eje Oy). 
El nuevo origen de coordenadas se determina del sistema de ecuaciones 
x+y-3=0, 
[ 342 =0, 


de donde x =p e y = 2. La ecuación del eje Ox' (en el sistema antiguo 
de coordenadas) es 


+= (Vi-D(*-3) 
y la ecuación del eje Oy es 
-(v2+1) ( 


En la fig. 16 se representa la gráfica de la curva. 
6.xi-2xy+y"+4x—6y+1=0,4 =0, 4p =2, 
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Fig. 16 


Las direcciones de los nuevos ejes coordenados son 
e Ñ 
k==p=1 (0, 
=1 (je Oy). 
La ecuación del eje de la parábola es 
(y 4D) (—x+y-3) =0, 
es decir, 
xy +3 0 





Resolviendo esta ecuación y la ecuación de la curva, obtenemos las coordenadas 


del vértice dela parábola: x o — 7 -Laccuación delnuevoeje Oy es 


y 





Fig. 17 
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mM a a 
re) so 


Hemos obtenido anteriormente la ecuación canónica de esta parábola en la 





forma ria El signo en el segundo miembro se determina por la 


Aisen de Ox”. De la ecuación de la curva obtenemos, expresando y me- 
nte x, 


y=x+34 VE 


Por consiguiente, la curva se encuentra en la región x5»--4, es decir, a la 
derecha del eje Oy”. Orientando el eje Ox' a la derecha, deberemos tomar en la 
ecuación canónica el signo más (y orientando el eje Ox' a la izquierda, el signo 


menos), 
En la fig. 17 se representa la gráfica de la curva. 


$ 4. Estudio de la ecuación general de una superficie de 
segundo grado 


En cste parágrafo sólo nos ocuparemos de la reducción de la ecuación 
general de una superficie de segundo grado a la forma canónica. 

Supongamos que en un sistema de coordenadas cartesianas rectangulares 
del espacio se tiene una ecuación 


10D = ax t+2a + 0)*+ Zar +2agyz + 
+agrt+2ax+2ay+2ayt+a m0. (17) 

Consideremos la forma cuadrática de tres variables 

Ayxi+2aaXy +0) "+ Zar + Zag p2+ agp. 


En una base determinada, también ortonormal, esta forma se reduce a la suma 
de cuadrados 


Ax y da 
La ecuación (17) se reduce, entonces, a la forma 
ARRAY de + +20, +2b93 4D = 0. 


Se pueden dar tres casos: 


1. Todos los 4; son diferentes de cero. 
TL. Uno de los valores de A, es igual a cero. 
KI. Dos de los valores de A; son iguales a cero. 


Consideremos por separado cada uno de estos casos. 
1 AAA, 9 0. 
Igual que en el caso de una curva de segundo grado podemos deshacernos 
entonces de los términos de primer grado 
y ay Ao 
trar 2) + (y+ 2) +afr+7) +e=0, 
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Realizando la sustitución 


es decir, realizando una traslación paralela de los ejes de coordenadas, obtene- 
mos la ecuación 


AA 
a 
nuevo origen de coordenadas). 

Aceptemos que c < delo contraio eultiplicaremo la ccunción por -» 
Siendo £ < 0, Laia e 


3 Jas. 
4. 2 <0, 2 <0, A, <0 (un «conjunto vacio» de puntos que también se 
denomina «elípsoide imaginario»). 

Si c = 0 y todos los A, son del mismo signo se tiene un punto (un «cono 
imaginario»); si e = 0 y los A, tienen signos diferentes, resulta un cono. 

IL, Uno de los coeficientes 4, es igual a cero; supongamos, por ejemplo, que 
A, = 0, Realizando la traslación correspondiente del origen de coordenadas, 
podemos reducir la ecuación de la superficie a la forma 

Ax +A" 2b 2 +b = 0. (18) 
Aquí se pueden dar los casos ba = 0 y by yt 0. 

Si b, = 0, la ecuación se reduce a la forma 

APTA Hb = 0. 

Esta es la ecuación de una superficie cilíadrica cuya forma se determina por su 
directriz Ax" + 22y*+b = O en el plano x'0'Y (un cilindro elíptico, un cilindro 
hiperbólico, dos planos que se cortan, una recta O dos «planos imaginarios» que 
seco alo largo de esa recta sl, cola ecos de gunos oa acnaro 
elíptico imaginario»). 

Sib, »+ 0, la ecuación (18) se reduce a la forma 

A+ day 42652" = O. 

Sies fdo — 0, se tens un paraboloid eírico y sidad < O, se tine sn 
'araboloide h 


pare 
TIL. Dos de los números A, son iguales a cero; sea, por ejemplo, % = 0 y 
2, = 0. La ecuación (17) se reduce a la forma 


Ax 42 +2b57'+b = 0. as 


Sib =0y 6 = e de o ps di o 
confundidos para b = Oe «imaginarios» para Ab > 
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Finalmente, si al menos uno de los coeficientes bx, b, es diferente de cero, 
tomemos en la ecuación (19) 


es fácil ver que esto equivale a pasar a una base mueva (también ortonormal) 
siendo la matriz del cambio igual a 





VEA V+b 
La ecuación (19) se transforma en 
Ax 42 /OLFE Y +b = 0 


y, puesto que V/BI-+85 »e O, esta última ecuación se transforma mediante una 
traslación del origen de coordenadas en 

Ax 42 EFE YO 0, 
Tenemos un cilindro parabólico. 

Observemos, sin demostrarlo, que (igual que en el caso de una curva de 


segundo grado) para la transformación de la ecuación de una superficie de 
segundo grado pueden ser empleados los invariantes. Estos serán ahora 


$1 = Ay +0 +0, 














AS Al 
am tel las 0 
Ay da Oy 

dsd: da e 
ly 0 da 








(estos números coinciden, salvo el signo, con los coeficientes del polinomio 
característico de la matriz 


RES] 


Mia Mes Ara 
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y el determinante 
A 
We da da a 
Oy de as a 
a. 4% 4 


La ecuación de una superficie con centro se reduce: 
AAA YAA ZAS 0. 
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El determinante A se anula si, y sólo si, la superficie es cónica o cilindrica 
(en particular, si se descompone en dos planos, distintos, confundidos o 


«imaginarios»). 


CAPÍTULO VIII 


CONCEPTOS PRINCIPALES DE LA TEORÍA ESPECIAL 
DE LA RELATIVIDAD 


$ 1. Espacios bidimensionales provistos de producto escalar 


Sea R un espacio lineal en el que está definido el producto 
escalar, es decir, a todo par de vectores x e y de R corresponde un 
número (real) (x, y) tal que 


D(5,)=0,%), 

2) (ax, y) =a(x, y), 

3) (++), 2) = (5, 2)+0, 2) 
para todos los x, y, z de R y para todos los números reales a. 
Obsérvese que no se exige el cumplimiento de la condición 4 
(pág. 132). Estos espacios se llaman espacios provistos de una mé- 
trica cuadrática ya que, dada una base, el cuadrado escalar (x, x) 
del vector x es una forma cuadrática de sus coordenadas. 

Se llama longitud o módulo de un vector a la raíz cuadrada de su 
cuadrado escalar. Notemos que, hablando en términos generales, 
un vector no nulo puede ser de longitud nula o incluso imaginaria. 
(Si (x, x) a? < 0, se toma por definición que |x| = aí, donde 
a>0ei=vy-1,) 

Si en el espacio R se escoge una base, el producto escalar se 
representa por una forma bilineal simétrica 


(5,y) = $ guxx 
he 








en las coordenadas x; e y, de los vectores x e y. La forma cuadrática 
correspondiente se reduce en una base (en general, nueva) a la 
suma de cuadrados 


50 a 
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($ 3 del capítulo VI). Además, el número p de los cuadrados positi- 
vos y el múmero q de los cuadrados negativos son unos invariantes 
del espacio R (ley de inercia de las-formas cuadráticas,$ 4 del capí- 
tulo VI) y determinan el tipo del espacio. 

Así, para el espacio bidimensional R (el plano) » y q pueden 
tomar los valores siguientes: 





En el caso | el cuadrado escalar de un vector cualquiera 
x= xi61+Xaes en una base determinada (ortonormal) es igual 
a xi+x] y este espacio es euclídeo. 

En el caso 1” se tiene (x, x) =-x1—x3 y el espacio no difiere 
esencialmente del euclídeo. 

En el caso 2 (o 2 que viene a ser casi lo mismo) la fórma cuadrá- 
tica (x, x) contiene sólo un cuadrado y en una base determinada se 
tiene (x, x) =x3 (o —x], respectivamente). Este plano se llama 
semieuclídeo, 

Finalmente, en el caso 3 la forma cuadrática (x, x) se reduce en 
una base determinada a la diferencia de cuadrados x? —x]; este 
plano se llama seudoeuclideo. 


$ 2. Plano semieuclídeo 


Sea R un espacio vectorial de dos dimensiones provisto de una 
métrica semieuclídea y sea ey, ez una base de este espacio en la que 
el cuadrado escalar (x, x) de un vector cualquiera x = x1€1+X2€2 
es igual a x3. En particular, se tiene 


(er, e1) =0, (62, eo) =1 


(e1+ez exter) = 1 = (61, e) + Aer e2)+ (62, e2) 


Aer e)+1, 
de donde resulta 


(er, e) =0. 
Llamaremos canónica a toda base de esta indole. 
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Sean x = x1€1 +38, € y = pre1-+ yaez dos vectores arbitrarios 
de R; el producto escalar (x, y) es igual a 


xyale, €1) + (Xy + xapD(er, €2) + xXaYalez, €2) = X2pa 
y el módulo del vector xesigual a 


lx] =VH = |x2). 

Sea ej, es otra base, también canónica, del espacio R y sea 
au ed 

Mar az, 


la matriz del cambio de la primera base por la segunda, es decir, 
e = Qes+ Ot) Y € = Qjg0,+ Oyster, 

Tenemos entonces 
(ej, e) = dá, = (6, e) =0, 

dedonde ds =0, y 
(6%, es) = ay = (es e) =1, 


es decir, d22 = +1. Por consiguiente, la matriz del cambio de una 
base canónica por otra es de la forma 


Pz o 


Fijemos ahora una base canónica cualquiera e, ez y definamos 
el ángulo entre los vectores x = X181+x282 € Y = y101+ poes tomán- 
dolo igual a 

A_% 

Ya Ya | 0) 
El ángulo así definido no resulta, en general, invariante respecto 
a un cambio por una base nueva (aun canónica). Veamos qué 
limitaciones debemos imponer a la matriz del cambio para que el 
ángulo (2) no dependa del sistema (canónico) de coordenadas. 
Al pasar a una base (canónica) nueva con: la matriz del cambio 
(1) las coordenadas de los vectores x e y se transforman, respectiva- 
mente, en 


4 = Ax 2 = 





AS AY RAd Ye =EY 


$ 2. Plano semienclideo 205 





siendo iguales los signos de x; e y¿. Según la definición (2), el ángulo 

entre los vectores x e y en la base nueva debe ser igual a 
A_%4|_| ayptad. _ ta | »_Al 
ai Ea ll 


y tendrá el mismo valor que antes si, y sólo si, aj =E1. Por ello, 
una vez escogida una base canónica, consideraremos a continuación 
sólo aquellas bases e;, es para las cuales la matriz del cambio de la 
base e,, es es de la forma 


+l ”] 
Pos 
(hemos tomado 412 = 0). 
Indiquemos por Ao la matriz 


E] o 


Es obvio entonces que 


oie 
«ol db a 
o 


Consideremos ahora un espacio vectorial puntual de dos dimen- 
siones en el que la distancia entre los puntos X(x1, X2) e Y (yx, Y2) se 


toma igual al módulo del vector XY = (y1—x1, YX») en la mé- 
trica semieuclídea, es decir, se toma igual a 


1Y2—x21 








o, en otras palabras, a la longitud cuclídea de la proyección del 
vector sobre el eje de las ordenadas. (En particular, la longitud de 
cualquier segmento paralelo a e, será igual a cero.) Se llama cir- 
cunferencia de radio r y de centro en un punto dade M(a;, a) al 
conjunto de todos los puntos que se encuentran á una misma dis- 
tancia semieuclídea r del punto M; este conjunto es el par de rectas 
paralelas al eje de las abscisas que se encuentran a una misma dis- 
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Fig. 18 


tancia (euclídea) r del punto dado M (fig. 18, a). Cualquier punto 
de la recta que pasa por M y es paralela a estas rectas también 
será un centro de esta circunferencia. La ecuación de la circunferen- 
cia de radio r y de centro en el punto M(a,, xa) es 

(2)? =P 


En particular, la ecuación de la «circunferencia unidad» (de la 
circunferencia de radio igual a la unidad) y de centro en el origen 
de coordenadas es 

4=1 

Se llama ángulo entre dos rectas al ángulo entre los vectores 


paralelos a ellas. Si x = (E, 1)e y = (n, 1) son dos vectores de longi- 
tudigual a la unidad, el ángulo entre ellos es igual a 


y se mide por el «arco» que estos vectores cortan en la «circunferen- 
cia unidad» (fig. 18, b). Observemos que en la métrica semieuclídea 
los ángulos suplementarios son iguales, ya que el ángulo entre los 
vectores (£, 1) y (9, —1) es igual a | = |E=g|, es de- 
cir, es igual al ángulo entre los vectores (£, 1) y (n, 1). 


Consideremos algunos teoremas de la «geometría semieuclídea elemental». 
eses El lado mayor de un triángulo es igual a la.suma de los dos otros 





e civamente, puesto que AB = A'B', AC= A'C', BC = B'C* (fig. 19, a) 
y A'B'= A'C'+B'C,, resulta que AB = ÁC+BC, es decir, e = a+, 
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Fig. 19 


Teorema 2. El ángulo mayor de un triángulo es igual a la suma de los dos 
otros ángulos. 

Para demostrarlo tracemos la recta CE || BA (véase la 8g. 19, 5) Tenemos 
entonces 4 ACE= A y 2ECD= B por ser ángulos de lados paralelos. 
Además, 2 ACE+ 2 ECD = 2 ACD = C y, por consiguiente, 

C= A+B. 


Teorema 3. Los lados de un triángulo son proporcionales a los ángulos 
opuestos. 
Para demostrarlo tracemos la recta CD ¡| e, (fig. 19, c). Tenemos entonces 


= <P (donde CD es igual al valor absoluto dela diferencia de las abscias 
de los puntos D y C, es decir, es igual a la longitud cuclídea del segmento CD) 
yB= 2 ¡luego A-b = 8-a, de donde resulta 
A B 
4.2. 


(Análogamente se demuestra aL E) 


Estas tres últimas afirmaciones permiten observar la cierta dualidad de los 
teoremas del plano semieuclídeo que se manifiesta en la paridad de los lados 
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y delos ángulos de un triángulo. Si sustituimos en los enunciados de estos teore= 
nas la palabra «lado» por la palabra «ángulo» y viceversa, el teorema 1 se 
convierte en el teorema 2 y el teorema 2 en el teorema 1; estos teoremas son 
duales uno del otro, El teorema 3 es el dual de sí mismo. 

Esta dualidad no se da en el plano corriente (euclídeo), donde existen rec- 
tas paralelas (el ángulo entre las cuales es igual a cero) pero no existen «puntos 
paralelos» (la distancia entre los cuales es igual a cero). Esta «injusticia» queda. 
salvada en la geometría semieuclídea, donde, además de rectas paralelas, exis" 
ten también «puntos paralelos» (e saber, los puntos pertenecientes a una recta 
paralela a e). 


$3. Plano seudoeuclídeo 


Sea R un espacio vectorial de dos dimensiones provisto de una 
métrica seudoeuclídea y sea e, es una base de este espacio en la 
que el cuadrado escalar de un vector cualquiera x = X1€1+xge2 es 
igual a 3-23. Tenemos, en particular, 


(e1, ex) = 1, (62, €2) ==1 


y 
(e1+es ente) =1 





=0= (8, e)+2e, e) +0, e) = 


= Aer, en), 
de donde resulta 


(er, €) =0. 


Llamaremos ortonormal a toda base de este tipo. En una base 
ortonormal el producto escalar de los vectores 


x= Xe4+Xe) € y = Yit1+yots 
es igual a 

(%, y) =xy0 ed+ tarde e) trade e) = 

A AY Mas 
y el módulo del vector xes igual a 

(xl = VEA. 

Consideremos ahora un espacio puntual vectorial de dos dimen- 
siones en el que la distancia entre los puntos X(x;, xa) e Y (1, ya) se 
toma igual al módulo del vector YY = (y1—x1, Ya—x2)en la mé- 
trica seudoeuclídea, es decir, setoma igual a 


Gi Qu? 
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Fig. 20 


La circunferencia de radio r y de centro en el punto M(x, oa) 
es el conjunto de todos los puntos que se encuentran a una misma 
distancia (seudoeuclídea) r del punto M. Por consiguiente, la 
ecuación de una circunferencia de radio + y de centro en el punto 
M(a1, da) es 


(a)? aa)? = 


(en la métrica euclídea esta ecuación representa una hipérbola si 
r % 0 y dos rectas que se cortan si r ; véase la fig. 20). El radio 
de esta circunferencia puede ser positivo, nulo o incluso «imaginario 
puro». Así, la ecuación de la circunferencia de radio positivo r = a 
y de centro en el origen de coordenadas es 


43 = e 








(una hipérbola de eje real horizontal). La ecuación de la circun- 
ferencia de radio imaginario r = ai (y del mismo centro) es 


de 


82539 
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Fig. 21 


(una hipérbola de eje real vertical). Estas dos familias de circun- 
ferencias están separadas por la circunferencia de radio nulo 

4-4 =0 
(dos rectas que son las asíntotas comunes de ambas familias de 
hipérbolas; véase la ig. 21). 

Los vectores x e y son ortogonales (en este caso continuaremos 
escribiendo x 1 y) si el producto escalar de los mismos es igual a 
cero, es decir, si 

(%, y) = xy M0Ya = 0. 
En este caso tenemos 

4-%; 
Xx »n” 
luego son inversos los coeficientes angulares de estos vectores 
considerados en la métrica euclídea; por consiguiente, si represen 
tamos en el plano euclídeo los vectores, ortogonales en la métrica 
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Fig. 22 





seudocuclídea, resulta que ellos son simétricos —en cuanto a la 
dirección— respecto a la bisectriz del primer y tercer cuadrantes 
(véase la fig. 22 en la que se tiene es 1 ez, 41 1 ds y bi L bo). 

Todo vector tal que |x1| = | xa] es ortogonal a sí mismo y es de 
longitud nula. Para los vectores de longitud real se tiene | x1 | > |x| 
y para los vectores de longitud imaginaria resulta |x| < |x2] 
(véase la misma fig. 22; los vectores es, a, y b, son de longitud real, 
los vectores e», dz y ba son de longitud imaginaria, mientras que el 
vector c es ortogonal a sí mismo y |e| = 0). 





$ 4. Aplicaciones seudoortogonales 

Una aplicación lineal A de un espacio seudoeuclídeo se llama 
seudoortogonal si conserva el producto escalar, es decir, si 

(Ax, Ay) =(x, y) 


para todos los x, y € R. 
Sea dk una aplicación seudoortogonal de un plano seudoeuclí- 
deo R y sea 


dh Ea al 
TS 
su matriz en una base ortonormal e,, ez. Tenemos 
Ae, = aer + ames, 
chez = ar2e1+ ayer. 


e 
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Por definición, 
(ote, key) =(e1,e1) =1, 
(tez, Ae») = (es, es) ==1 


(Aer, Aer) = (e1, es) =0, 





es decir, 
da =1, 
(42) 
a =— 1, 
Y 
A 019091 :029 =0. (4b) 


De la igualdad (4a) resulta que a11 7 0 y 22 »+ 0. De la igual- 
dad (4b) se deduce que 





Indicando por $ las razones iguales (5), obtenemos 
Aa = Ban, 6) 
Aya = Para. 


Introduciendo estos valores en las igualdades (4a), encontramos 


1 
da Páñ, = 1, de donde an =¡=3 > 


1 
— dí = —1, de donde da = 735 

Pt dee VI-P 

por consiguiente, la matriz de la aplicación A es de la forma 
o 
ivi- T= 

da A Poy : P A o 

iVI-R ivi-P 

con la particularidad de que ambos elementos de la primera co- 

Jumna y ambos elementos de la segunda columna se toman, como 
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puede verse de las igualdades (6), con el mismo signo. Llamaremos 
seudoortogonal a toda matriz de este tipo. 

Si'indicamos por Ao la matriz 


o A 
As VER vi-P 


e |" 
vip vi-P 
es fácil ver que 
e 
dió v-A vi-A 
ES 


a la ds 
NA Y 


h= 





0 
A =4.[ 0 sl 
VER VIA 
(las aplicaciones cta y cta difieren de cto en una simetría axial, 


mientras que la aplicación cts difiere en una simetría central), 


Paralos determinantestenemos | 40 | =/43| =1 y |41] =]42|= 
=-l 


Observemos que, por ser 





! AF => 1, existe un valorg tal que 
= sh p; luego 
VEA 


hp 5) 
Las cho" 





=chpy 





Si £ varía continuamente desde O hasta 1 (o desde O hasta —1), 
los extremos de Jos vectores otoe, y ctoes se deslizan continuamente 


noma 
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a lo largo de las circunferencias unidades 3-4 = +1, uno hacia 
el otro si $ — 1 y en direcciones contrarias si $ => —1. 

Supongamos que en un plano seudoeuclídeo R se tienen dos 
bases ortonormales ex, es y e, e2 y sea 


E (a Bal 
O as 
la matriz del cambio de la primera base por la segunda. Considere- 
mos la aplicación lineal ot de matriz A en la base es, ea y demostre- 
mos que es seudoortogonal. Efectivamente, tenemos por hipótesis 


Ae: = anes+anes = e 
y 
oler = Gre: + ans = e. 


Si x= xj01+Xaé2 € Y = y¡€1+ paez son unos vectores cuales- 
quiera de R, se tiene 


Ax = xcte+xcte = xt xt 


Ay = yoterk yates = yrei+ ot. 
Puesto que ambas bases e,, es y es, es son ortonormales, el producto 
escalar 


(Ax, Ay) =x1Y1—xXYa = (%, y). 


Por consiguiente, la aplicación cf es seudoortogonal y su matriz 
es de la forma (7). 


$ 5. Espacio de sucesos. Principio de relatividad de Galileo 


Supongamos que un punto M se desplaza por una línea recta 
1 en la que se ha establecido un sistema de referencia S. Esto signi- 
fica que dicha recta está provista de una escala con las divisiones 

ivas y que en todos los puntos de la recta se tienen relojes 
sincronizados entre sí. 

Supongamos que en el instante de tiempo 1 la coordenada del 
punto M es igual a y. Este hecho o, como diremos, «suceso» 
puede ser indicado en un plano P(de dos dimensiones) mediante el 
punto de coordenadas (x, 1). El plano P se llama espacio de sucesos. 

Las coordenadas del punto en el espacio de sucesos varían.con 
el transcurso del tiempo, aun cuando el punto M no altera su posi- 
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ción sorbe la recta / (debido a la variación del tiempo 1). Por 
consiguiente, la existencia del punto en el espacio y en el tiempo se 
manifestará por una línea en el plano P. Esta línea será recta si, 
y sólo si, el punto M se desplaza por la recta | con una velocidad 
constante u; en este caso su posición en el plano P se determina por 
la ecuación 

x=ut+b, 
donde b = x(0) es la posición del punto en el instante £ = O. Si el 
punto M permanece inmóvil sobre la recta («se desplaza con veloci- 
dad nula»), la recta que le corresponde en el plano P será paralela 
al eje £. 

Supongamos que a lo largo de la recta / se desplaza uniforme- 
mente con la velocidad v otro sistema de referencia S”, con la 
particularidad de que los origenes de coordenadas de ambos siste- 
mas coinciden én el instante inicial: x =x" =0 para 1 =0. En 
este caso la coordenada x del punto M en el sistema $ y su coorde- 
nada x' en el sistema S' estarán ligadas por la relación 

x=x+ol 
Aquí se supone que el tiempo / en el sistema S y el tiempo £' en el 
sistema S” es el mismo, es decir, que £ = f' para un mismo suceso. 

Las transformaciones 

x=x+ot, 

t=f 
o, que viene a ser lo mismo, 
x= x—ot, 

l=t 
se llaman transformaciones de Galileo. Derivándolas respecto a t, 
obtenemos de aquí 

de _ de 


(8) 


u=44o, (9) 
donde u es la velocidad del punto en el sistema S y u' es su veloci- 
dad en el sistema S'. Esta es la ley de composición de velocidades 
en la mecánica clásica: la velocidad u del punto en el sistema anti- 
guo de referencia es igual a su velocidad u' en el nuevo sistema 


ye 
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sumada a la velocidad de «traslación» Y (a la velocidad del nuevo 


sistema de referencia respecto al antiguo). Derivando una vez más 
respecto a t, obtenemos 


Lx _ de 

de = "an * 
Por consiguiente, son idénticas las aceleraciones del punto M en el 
sistema S y en el sistema S”, por donde llegamos a la conclusión de 
que fuerzas iguales provocan en ambos sistemas iguales efectos 
(que se describen por la segunda ley de Newton: la aceleración 
provocada por una fuerza F es proporcional a esta fuerza). Esto 
mismo se expresa en otras palabras diciendo que las leyes de la 
mecánica son invariantes respecto a las transformaciones de Galileo 
(principio de relatividad de Galileo). 

Volvamos a las fórmulas (8). Se ve de ellas que al pasar del 
sistema $ al sistema S' las coordenadas de los puntos del espacio 
de sucesos se someten a una aplicación lineal de matriz 


q co 


Este hecho sugiere la idea de introducir en el espacio de sucesos la 
métrica semieuclidea. La distancia entre dos sucesos A(Xi, t1) y 
B(xa, ta) obtiene entonces un sentido físico concreto: es igual a 
[1241 |, es decir, al intervalo temporal entre los sucesos A y B. 

Además, como el cambio de un sistema de referencia por otro 
se determina por la matriz (10), también resultará invariamte el 
concepto de ángulo introducido en el $ 2. Para ver su sentido 
físico, consideremos dos puntos Mi y Ma que se desplazan unifor- 
memente a lo largo de la recta 1. Indiquemos por 141 y us sus veloci- 
dades respectivas. En el plano P el movimiento de estos puntos se 
determina por unas rectas m, y ma. Sea Ao(xo, to) el punto de inter- 
sección de estas rectas (esto significa que para f = fo ambos pun- 
tos Mz yMa tenían la abscisa xo y se encontraban en un mismo 
lugar de la recta /). Supongamos que para 1 =f la abscisa del 
punto Mi es x, y que para f = te la abscisa del punto Ma es xa. 
En estas condiciones el ángulo entre las rectas mm, y ma (en la 
métrica semieuclídea) es igual al ángulo entre los vectores 4041 
y Ao4s, donde Ay(x1, tx) y As(xa, ta) (Sig. 23); luego es igual a 

247% 417%, 


| = hub, 
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Fig. 23 


es decir, es igual a la velocidad relativa del movimiento de estos 
puntos. 

Si la distancia y el ángulo se interpretan de esta forma, los 
teoremas 1, 2 y 3 de la pág. 206 obtienen un sentido físico concreto 
que el lector podrá establecer. 


$ 6. Principio de relatividad de Einstein 


Es natural hacer la siguiente conclusión de la ley (9) de compo- 
sición de velocidades: si el sistema de referencia S' se desplaza 
uniformemente con la velocidad v respecto a S y si la luz se propaga 
en el sistema S con la velocidad c, su velocidad en el sistema 5” 
debe ser igual a c-—» en el sentido del movimiento del sistema 5” 
y a c+u en el sentido contrario. Sin embargo, Michelson, físico 
norteamericano, demostró experimentalmente en 1881 que sobre 
la Tierra móvil la luz solar se propaga con la misma velocidad en todas 
las direcciones. 

Después de los intentos de varios científicos de concordar los 
resultados de los experimentos de Michelson con la teoría, fue 
publicado en 1905 un trabajo fundamental de Einstein en el que se 
exponía una nueva teoría del espacio y del tiempo, la teoría de la 
relatividad especial. Consideraremos aquí sólo los conceptos más 
importantes y elementales de esta teoría. 

Einstein tomó como base de la teoría la ley de constancia de la 
velocidad de la luz en todos los sistemas inerciales de referencia. 


2 En Física se llama inercial a tal sistema de referencia en el que un 
cuerpo se desplaza uniforme y rectilíncamente cuando sobre él no actúan 
fuerzas exteriores. 
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Fig. 24 


Por consiguiente, el principio de relatividad de Galileo consiste 
en la imposibilidad de determinar el movimiento uniforme de un 
sistema mecánico respecto a otro mediante cualesquiera experimen- 
tos mecánicos realizados dentro de este sistema. El principio de rela- 
tividad de Einstein afirma que es imposible lograr esto aun basándose 
en cualesquiera fenómenos ópticos (relacionados, como se sabe, con 
el electromagnetismo) y no sólo mecánicos. 

Pero al aceptar la ley de constancia de la velocidad de Ja luz, 
Einstein se vió obligado a renunciar de la hipótesis de existencia del 
tiempo absoluto, válido para medir los intervalos temporales simul- 
táneamente en todos los sistemas de referencia. 

Esta relatividad del tiempo necesariamente se deduce de la ley de 
constancia de la velocidad de la luz como puede verse del siguien- 
te ejemplo sencillo”. Imaginémonos un tren, de dimensión lineal 
muy grande, cuya velocidad es comparable con la velocidad de la 
luz («el tren de Einsteir)). Supongamos que junto a la ventana de 
este tren se encuentra un observador que en un momento de tiempo 
determinado enciende una linterna enviando un rayo de luz hacia 
el techo. En el techo hay un espejo y el rayo después de reflejarse 
vuelve al observador. Desde el punto de vista de este observador la 
trayectoria del rayo de luz es el segmento AB recorrido dos veces 
(fig. 24, a). Para un observador, que se encuentra fuera del tren, 
la trayectoria del rayo de luz será la quebrada formada por los 
lados del triángulo isósceles cuya altura es igual a AB (fig. 24, b). 
Por consiguiente, desde el punto de vista del observador exterior 
la luz recorre una trayectoria mayor que desde el punto de vista del 
pasajero del tren. Puesto que la velocidad de la luz es constante, el 
tiempo que necesita la luz para recorrer esta trayectoria tomado 


» Hemos tomado este y el siguiente ejemplos del folleto de L. D. Landau 
y Yu. B. Rumer “Qué es la teoría de la relatividad”. Editorial MIR, 1972. 
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por el reloj del observador exterior será mayor que el tiempo toma- 
do por el reloj del pasajero: el reloj dentro del tren se retrasa en 
comparación con el reloj de la estación. 

También el concepto de simultaneidad se hace relativo al acep- 
tar la ley de constancia de la velocidad de la luz lo que puede verse 
con claridad en el ejemplo siguiente. Supongamos que en el centro 
de un vagón de este mismo tren de Einstein se encuentra un obser- 
vador que en un momento determinado del tiempo enciende una 
linterna. Las puertas del vagón están provistas de un mecanismo 
que permite abrirlas en cuanto la luz llegue a ellas. El observador 
que se encuentra en el centro del vagón verá como la puerta delan- 
tera y la trasera se abren simultáneamente. En cambio, desde el 
punto de vista de un observador exterior la puerta delantera se aleja 
del rayo de luz mientras que la puerta trasera se acerca a éste. 
Como la velocidad de la luz es constante, desde el punto de vista 
del observador exterior la luz llegará a la puerta delantera más 
tarde que a la trasera y ésta se abrirá antes. 

Es más, incluso el orden en el que se realizan los sucesos puede 
resultar diferente para estos observadores. Si (debido a un defecto 
en el mecanismo de las puertas) la puerta trasera se abre transcu- 
rrido un tiempo después de que la luz llegue a ella y si esta diferen- 
cia en el tiempo es suficientemente pequeña, para el observador 
exterior la puerta trasera continuará abriéndose antes que la delan- 
tera mientras que para el observador que se encuentra en el centro 
del vagón el orden de estos sucesos será el inverso. 


$7. Transformaciones de Lorentz 


Nos vemos obligados, pues, a prescindir de la hipótesis de que 
el tiempo es el mismo en todos los sistemas de referencia que se 
desplazan uniformemente unos respecto a otros. No podemos 
aceptar ahora que f' = f para un mismo suceso. ¿Cómo están rela- 
cionadas las coordenadas x, t de un punto en un sistema $ con las 
coordenadas x', 1” de este punto en un sistema S” que se desplaza 
uniformemente con la velocidad v respecto a S? En la mecánica 
clásica esta relación es lineal (transformaciones de Galileo). 
Mantendremos esta hipótesis de que x', ' dependen linealmente de 
x, 1. El paso de S a S” corresponde entonces al paso a una base 
nueva en el espacio de sucesos. ¿Cúal es la métrica de este espacio? 

Supongamos que los orígenes de los dos sistemas S y 5” coinci- 
den en un determinado momento del tiempo (inicial para ambos 
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sistemas): x=0 y x =0 para 1=0 y 1 =0. Supongamos, 
además, que en el momento t = f' =0 se envía, desde el origen 
de coordenadas común de ambos sistemas, una señal luminosa que 
en el sistema .S se recibe en el punto x y en el momento 1 y en el 
sistema S” se recibe en el punto x' y en el momento 1”. Puesto que 
la velocidad de la luz c es constante, se tiene 








de donde resulta que x?—c*? =0 y x2—ct1? =0. Luego, si la 
expresión 
een (11) 


es igual a cero en un sistema inercial de referencia, será igual a 
cero en todos los demás sistemas. Aceptaremos ahora adicional- 
mente que /a expresión (11) es, en general, un invariante, es decir, 
que esta expresión es la misma en todos los sistemas inerciales de 
referencia, 

Tomando x =x, y ct =xa (y, respectivamente, x'=x] y 
cf = x¿), podemos considerar muestro cio de sucesos como 
un plano seudoeuclídeo en el que la expresión (11), igual a 


4-4 


es el cuadrado de Ja distancia entre el punto (x1, x») y el origen de 
coordenadas o, que es lo mismo, el cuadrado de la longitud del 
vector correspondiente. Pero la base en la que el cuadrado de la 
longitud de un vector toma esta forma es ortonormal. Por esta 
misma razón será ortonormal la base correspondiente del sistema 
5”; luego la matriz A del cambio de la base del sistema S por la 
base del sistema S' es seudoortogonal 





1 

VB ivI=P 
8 

EVER ivVi=R 


(y en cada una de las columnas se toma sólo-un signo). 
Por consiguiente, 


se A = Puta 
q= % 
¡rev EF 


A= 
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Consideremos primero el caso en el que ambos denominadores 
son positivos y la matriz A es 


1 g 


lo = 8 1 


Las coordenadas x1, Xa y Xi, xa están ligadas entonces por las rela= 
ciones 
ES 


Y? 








(2) 


Expresando de aqui x' y f' mediante x y 1, obtenemos las fór- 
mulas 


y 380 
“=VEF" 
¿Cuál es el sentido físico del parámetro $? Consideremos en el 

sistema S' un punto inmóvil M, por ejemplo, el origen de coordena- 


das x' =0, Según la primera de las fórmulas (13), tenemos para 
este punto 


x—fer =0 





(13) 





Fm bo, 
Pero + es la velocidad del punto M en el sistema $ y es igual, 


evidentemente, a la velocidad del sistema S” respecto a S. Por 
consiguiente, 


v=fc y Baz. 
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Introduciendo este valor de $ en las fórmulas (12) y (13), 
obtenemos 


A 
E 


04) 





(15) 





Las transformaciones (14) y (15) se llaman transformaciones de 
Lorentz. Observemos que las fórmulas (15) se obtienen de las fór- 
mulas (14) cambiando simplemente el signo de v. 

Hemos supuesto que en Ja matriz del cambio de la base e,, es 
por la base ej, es todos los denominadores son positivos. Demostre- 
mos que los demás casos pueden ser excluidos. Si en la segunda 
columna de la matriz del cambio aparecen los signos «—» (y en 
la primera, cualesquiera), obtenemos las fórmulas 


Po 
ar e 


E 


aquí a un aumento de £ corresponde una disminución de 1 y esto es 
imposible, ya que en este caso el orden de todos los sucesos en el 
sistema S” será inverso al orden de estos mismos sucesos en el 
sistema S. Si los signos menos aparecen en Ja primera Columna de 
la matriz del cambio (y en la segunda columna figuran los signos 
más), obtenemos las fórmulas 


ha "o a 
de estas fórmulas se puede pasar a (14) cambiando el signo de x”, 
es decir, cambiando la dirección del eje Ox' por la contraria. 

Las fórmulas de Lorentz tienen sentido sólo para [A < 1, de 


donde resulta que |1|< c, ct que es imposible el movimiento 
con la velocidad que sobrepasa la velocidad de la luz. 


Ex4ot 














eS 
E 
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Fig. 25 





Si » es pequeño en comparación con c, tenemos V 1 mes = 
1 y en este caso 

xn, Ut 
Por consiguiente, siendo pequeño el valor de v (en comparación 
con c) las transformaciones de Lorentz se convierten en las transfor- 
maciones de Galileo de la mecánica clásica. 

Sean Ox y Ot los ejes coordenados del espacio de sucesos del 
sistema S y sean Ox' y Of los ejes del sistema S' (fig. 25). Como 
sabemos, los ejes Ox” y Of son simétricos respecto a las bisectrices 
MM' y NN' de los cuadrantes del primer sistema. El eje Of puede 
ser considerado como la gráfica del movimiento del origen de 
coordenadas de S” respecto a S: para todos sus puntos se tiene 
x' =0, Recíprocamente, el eje Or es la gráfica del movimiento del 
origen de coordenadas del sistema .S respecto a S”. El valor abso- 
luto de la tangente del ángulo que el eje Or” forma con el eje Ox 
es igual a 
El 

ep 
donde] = ves la velocidad con la que el sistema 5” se desplaza 
respecto a S. Puesto que |» |< -c, resulta que el valor absoluto de 
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esta tangente es mayor que la unidad, es decir, que todos los ejes 
de tiempo Ot se encuentran dentro del ángulo MON y que, por con- 
siguiente, todos los ejes espaciales Ox se encuentran dentro del 
ángulo MON". 

Para las rectas MM' y NN' tenemos |-2-| = 1, es decir, [o] =05 
entodos los sistemas de referencia ésta es la gráfica del movimiento 
con la velocidad de la luz. 


$8, Algunos resultados que se deducen de las fórmulas 
de Lorentz 


1. Regla de composición de velocidades. 
De la igualdad (15) obtenemos 


de _ de de 
dr ada 














Y= 





a 
Al 
de donde resulta 
q 
CA 
GQ 


Esta es la nueva fórmula de composición de velocidades. 
Siendo u =.c, de la fórmula (16) obtenemos 


sy c-» 





=c 


pen 
5 


y, recíprocamente, siendo 4” = c, también 
cho 





Ho, 
Ll 
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Si u y v son pequeños en comparación con c, se tiene y" = 4-0. 

2. Relatividad de la simultaneidad. 

Supongamos que los sucesos A y B acaecen en el sistema S 
para un mismo momento del tiempo t en los. puntos con abscisas 
diferentes x, y xa. En el sistema S” estos sucesos acaecerán, según 
la segunda de las fórmulas (15), en los momentos 


E 


YE 


de donde resulta 


Gx + + 








es decir, dos sucesos simultáneos en un sistema de referencia no serán 
simultáneos en otro sistema. Además, la diferencia t¿—+ puede ser 
positiva y negativa según el signo que tenga la diferencia xy —x2. 
Esto queda muy claro gráficamente: si los sucesos A y B son simul- 
táneos en el sistema S, el segmento AB debe ser paralelo al eje Ox 
y, si son simultáneos en el sistema S”, este segmento debe ser para- 
lelo al eje Ox”. 

Es más, incluso el orden de los sucesos puede ser distinto en los 
istemas S y $". Por ejemplo, en la fig. 25 los sucesos A y A' son 
simultáneos en el sistema S (44'I/Ox) con la particularidad de que 
A' acontece, obviamente, después de O y, por consiguiente, tam= 
bién A ocurre en S después de O. En el sistema S” los sucesos A y A” 
son sumultáneos (44”]|Ox”) y, por consiguiente, el suceso A (igual 
que 4”) antecede al suceso O. 

Naturalmente, aquí surge el siguiente problema: ¿no podría 
ocurrir que, por ejemplo, un suceso O que en el sistema S es causa 
de un suceso A ocurra en otro sistema S” después de A lo que esta- 
ría en contradicción con el principio de casualidad? Demostremos 
que esto no tiene lugar. 

Los puntos correspondientes a los sucesos que en el sistema S 
suceden después del suceso O son aquellos puntos, y sólo aquellos, 
que se hallan por encima del eje Ox; los puntos correspondientes a 
los sucesos posteriores al suceso O enel sistema S'son los puntos que 
se encuenran por encima del eje Ox”. Puesto que todos los ejes espa- 
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ciales pasan por el interior del ángulo MON" (véase el final del 
$ 7) y como es evidente que cualquier recta de este tipo es el eje 
espacial de un sistema de referencia, resulta que /a intersección de 
todos los semiplanos, superiores a algún eje espacial, es el ángulo 
MON formado por aquellos sucesos, y sólo aquellos, que son posterio- 
res a O en todos los sistemas de referencia (este ángulo puede ser 
denominado «dominio del futuro»). Análogamente el ángulo M'ON” 
representa el conjunto de todos los sucesos que en todos los sistemas 
de referencia anteceden al suceso O (el «dominio del pasado»). 

En cambio, los puntos pertenecientes a los ángulos MON' y 
NOM corresponden a los sucesos que en unos sistemas de referen- 
cia preceden a O y en otros sistemas siguen a O. Sin embargo, 
ninguno de estos sucesos no puede tener como causa el suceso O. 
Efectivamente, si el suceso O ha sido causa del suceso A(x, 1) 
(véase la misma fig. 25), debe existir una perturbación que se des- 
plaza desde O hacia A. Pero esto es imposible ya que la longitud 
del vector OA es real y, por consiguiente, en todos los sistemas de 
referencia tenemos para este vector 


x12—ct > 0, es decir, x? > ci, 
de donde resulta 
les 


luego, la velocidad u = de esta perturbación debe ser superior 


a la velocidad de la luzlo cual es imposible. 

Análogamente se demuestra que la ley de la causalidad es válida 
para cualesquiera dos sucesos Á y B: si A puede ser causa de B, 
es decir, si existe una señal que se propaga (en el sistema de referen- 
cia dado S) desde A hacia B con una velocidad v < c, el suceso A 
antecede al suceso B'en todos los sistemas inerciales de referencia. 

3. Contracción de las longitudes. 

Supongamos que una barra de longitud | reposa en un sistema 
Sy indiquemos por x1 y xz, donde x, < xz, las coordenedas de sus 
extremos; en estas condiciones 


l=x-X%: 


Para determinar la longitud /' de la barra en un sistema $”, debemos 
indicar las coordenadas de sus extremos en un momento cualquiera 
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Fig. 26 


Y' (tel mismo para ambos extremos!). Si estas coordenadas son 
Xj Y xj, tenemos de acuerdo con la primera de las fórmulas (14) 


Ao 


n=, 2 
vi 


de donde resulta 











o, tomando en cuenta que la longitud /' de la barra en el sistema S” 
es igual a x2—xj, 


t=ty/ ” 


Por consiguiente, la longitud l' de una barra en un sistema de 
referencia respecio al cual la barra se desplaza es menor que su 
longitud en el sistema respecto al cual la barra reposa. 

Expliquemos este resultado gráficamente. Sea A el punto de 
intersección de la hipérbola x?—c*%f = [? y del eje Ox (fig. 26); su 
distancia hasta el origen de coordenadas es igual en el sistema S 
a 1. Si 44! || Ot, los puntos A y 4' se encuentran en el sistema S 





<l 
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a una misma distancia / del origen de coordenadas. (Es un mismo 
punto, que reposa en el sistema ¡S, considerado en diferentes mo- 
mentos del tiempo.) Pero en el sistema S” la distancia entre el 
punto 4' y el pera de coordenadas es igual a OA”; luego es menor 
que OB iguala /. 

Recíprocamente, el punto B, que es el cruce de la hipérbola 
2-8 = R y del eje Ox, se encuentra en el sistema S' a una 
distancia / del origen de coordenadas. Si BB' || Or', el punto B' en 
el sistema S” se encuentra a la misma distancia / del origen de coor- 
denadas; sin embargo, en el sistema S la distancia entre el punto B” 
y el punto O es igual a OB" < OA = l; luego, la contracción rela- 
tivista, es decir, relacionada con la teoría de la relatividad, de las 
longitudes es reciproca. 

Si ves pequeño en comparación con la velocidad de la luz, esta 
contracción de las longitudes en un sistema móvil es tan pequeña 


que en Ja práctica no puede ser observada. (Puesto que l'= 


al e ' s Mia 
= ly = =1(1-£), resulta que la diferencia /-1! = 


, 
= 19 = 4 (2) es del segundo orden respecto a.) Por ejemplo, 
desde una nave cósmica (con la velocidad de 12 km/s) el diámetro 
de la Tierra (12 000 km) parecerá contraído solamente en 1 cm. 
4. Retraso del tiempo. 
Supongamos que en un reloj, inmóvil en un sistema S, ha trans- 
currido el tiempo T desde t, hasta fe: 


T=t-t 


Determinemos el valor t; correspondiente a 1,, y el valor 14, corres- 
pondiente a t,, en un mismo punto con la abscisa x' en el sistema ¡S”, 
De acuerdo a la segunda de las fórmulas (14), tenemos 
o v 
*+4 A+ 
pe p= 4 





ES 
¿e 
y de aquí resulta 


T=t-t= 
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Fig. 27 





donde T” = f¿—4 es el intervalo de tiempo que transcurre en el 
sistema S” mientras en el sistema S transcurre el tiempo T desde 
ty hasta ta; por consiguiente, 


T=TAq/1-%<T. 


Hemos encontrado que en el sistema S' que se desplaza respecto 
al sistema S el tiempo transcurre más lentamente que en el propio 
sistema S. Expliquemos este resultado gráficamente. Consideremos 
la hipérbola 


AAN AT 


(fig. 27) y sea A el punto de intersección de esta hipérbola con el 
eje Ot; en estas condiciones, su distancia temporal hasta el punto 
O, es decir, el tiempo transcurrido desde el suceso O hasta el suceso 
A, es igual a T en el sistema S. Si 44! || Ox, los sucesos A y A' son 
simultáneos en el sistema S. Pero en el sistema S” el tiempo trans- 
currido entre O y A' es igual a O4'; luego es menor que OB igual 
aT. 

Recíprocamente, en el sistema S' el punto B se encuentra a una 
distancia temporal 7 del punto O. Si BB' || Ox”, los sucesos B y B' 
son simultáneos en el sistema S”; sin embargo, en el sistema S la 
distancia temporal entre los puntos B” y O es igual a OB' y es 
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menor que OA igual a 7; luego, el retraso temporal lorentziano es 
recíproco. 

Si la velocidad + es pequeña en comparación con la velocidad 
de la luz, este retraso del tiempo en un sistema de referencia móvil 


es nada más que (Sy, es decir, es de segundo orden respecto 


a 7 y prácticamente no puede ser observado. Por ejemplo, para un 

cosmonauta las veinticuatro horas terrestres disminuyen en menos 
2 

TT] de segundo. 


5, Aumento de la masa de un cuerpo en movimiento. 

Sin exponer más resultados de la teoría de la relatividad, men- 
cionaremos solamente el fenómeno del aumento de la masa de un 
cuerpo móvil. 

Si sobre un cuerpo actúa una fuerza constante, la velocidad desu 
movimiento, en las condiciones corrientes, aumenta proporcional- 
mente al tiempo de acción de la fuerza. Sin embargo, debido a la 
existencia de la velocidad límite, esta proporcionalidad no puede 
mantenerse también para las velocidades grandes. Para las velo- 
cidades comparables con la velocidad de la luz el aumento ulterior 
de la velocidad se detiene: el cuerpo ofrece una mayor resistencia 
ala fuerza que sobre él actúa. Podemos decir que aumenta la masa 
del cuerpo. Resulta que 


Y 

E 
donde mn es la masa del cuerpo en movimiento, v es su velocidad y 
mo es la masa de reposo, es decir, la masa que tiene el cuerpo res- 
pecto al sistema de referencia en el que este cuerpo reposa. Por 
ejemplo, si en un acelerador moderno un electrón alcanza una 


velocidad que sólo en 30 kru/s difiere de la velocidad de la luz, la 
masa de este electrón aumenta casi 70 veces: 








Mo LA A A 


A cho er co 
Voz y a v> a 
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Hemos considerado el movimiento de un punto a lo largo de 
una línea recta. En el caso general, en €l que un sistema espacial de 
referencia se desplaza uniforme y rectilíneamente respecto a otro 
sistema, la dirección de este desplazamiento puede ser tomada 
comó la del eje Ox y entonces en la mecánica clásica se tiene 


X=x=0l, y =p Y=z Y 





mientras que en la teoría de la relatividad se tiene 


v 
+ 





El espacio de sucesos es en este caso de cuatro dimensiones. 
La contracción de las longitudes (sólo en la dirección del desplaza- 
miento) y el retraso del tiempo en un sistema de referencia móvil se 


manifiestan en la misma razón q/1-2. 


CAPÍTULO IX 


NOCIÓN DE TENSORES 


$ 1. Ejemplos de tensores 


Anticipemos a la definición general de un tensor algunos ejem- 
plos. 

1, Función lineal. 

Sea f(x) una función lineal ($ 1 del capítulo VI) en un espacio 
vectorial R de n dimensiones. Tomemos en R una base ey, €2, ...., €n 
y sea 

x=xa+x0e+...+xen 


un vector cualquiera de R. (Ahora convendremos en escribir el 
índice de la coordenada arriba; la oportunidad de este convenio 
quedará justificada más tarde.) En este caso 


F0) = apra... + apx", 


donde a, =f(e;). 

Consideremos una base nueva ef, e», ..., €, Y Supongamos que 
los nuevos vectores básicos se obtienen de los antiguos mediante 
las fórmulas 


€ =de+der..+de= Y der. 00) 
EN 
En la matriz del cambio 
ados 
led... a a 
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convendremos ahora en emplear el índice superior para el número 
dela fila y el inferior para el número de la columna. Supongamos 
que en la base nueva se tiene x = )) x”ej; en este caso 

la 


10=hax o 
donde 
aro o (Eda)- Edro=Eda 
Pi AA ps 


Por consiguiente, una función lineal f(x) se determina en toda 
base por una fila de n números G1, Ga, ..., an y al pasar a una base 
nueva estos números se transforman según las fórmulas (4), es 
decir, se transforman igual que los vectores básicos (1). 
Convengamos ahora, pará abreviar las denotaciones, en que 
(regla de Einstein) si en una expresión cualquiera se repite dos 
veces, una vez arriba y otra vez abajo, un mismo índice, digamos i, 
esto significa que se realiza la sumación respecto a este índice 
(en los límites ¿=1, 2, ..., m) con la particularidad de que el 
A 

signo de la sumación ) se omite. Por ejemplo, tenemos por 
lar 

definición 

ce = y che, x= y dx", bra y bpial, cto. 

kl ll Ja 

Empleando esta denotación podemos escribir la igualdad (1) 
en la forma 

e = Cfés 
la igualdad (3) en la forma 

10) =ax", 

y la igualdad (4) en la forma 
aj = cias. 
Análogamente, si en una expresión aparecen dos pares, o un 


número mayor de pares, de índices iguales (y cada uno de estos 
índices aparece una vez arriba y una vez abajo), aceptaremos que 
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respecto a estos Índices se realiza la sumación y que todos estos 
Índices recorren independientemente los valores 1, 2, ..., m. Por 
ejemplo, 


die = $ ditp, d= Y diseto. 
d mar sar 

2. Vector 

Dada una base e,, €», . .., €, todo vector x queda representado 
por la fila (xl, x?, x") de n números que son sus coordenadas. 
En una base nueva e;, es, ..., e, este mismo vector se representa 
por otra fila (x', x'2, ...., x'») y si (2) es la matriz del cambio de la 
primera base por la segunda, tenemos, por lo visto en el $ 4 del 
capítulo H, 








X= del, (5) 
Esta es la expresión de las coordenadas antiguas mediante las 
nuevas. Busquemos de aquí las jones de las coordenadas 


nuevas x? mediante las antiguas x'. Sea C-1= [bf] la matriz 
inversa de la matriz C. De la igualdad 


CCA = CAC uE 





resulta que 
l sii 
de 44 siidj 
“Tomando 
Losiiaj 
= 
é la si i4j, 
tenemos 
deb == 8 


Multiplicando por bf, ambos miembros de la igualdad (5) (y, natu- 
ralmente, sumando respecto a k), obtenemos 


Mk = lg = El = 1 
(puesto que 6) =0 pará ¡ + ¿y $] =1) 0 
x= dp. 
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Por consiguiente, las coordenadas nuevas x' de un vector-x se 
obtienen de sus coordenadas antiguas x! mediante la matriz C, 
inversa de la matriz del cambio C, con la particularidad de que los 
coeficientes de los desarrollos de las x"! por las x! forman las filas 
de la matriz C7*. 

Los dos ejemplos considerados (el de función lineal y el de 
vector) tienen algo común que permite incluirlos en los márgenes 
de una definición general. Tanto una función lineal como un vector 
se determinan en toda base por n números —4;, %2, ..., Gn Y 
xl, x?, ..., x”, respectivamente— y al pasar a una base nueva estos 
números se transforman linealmente: mediante la matriz C, es decir, 
igual que los vectores básicos, en el caso de una función linea! y en 
el caso de un vector mediante la matriz C-1 que es la inversa de la 
matriz C. Los coeficientes de una forma lineal (así como las coorde- 
nadas de un vector) representan un ejemplo de un tensor, enten- 
diendo por un tensor un sistema de números dados en cualquier 
base que se transforman linealmente al cambiar una base por otra. 
La definición exacta de este concepto será dada más tarde; mien- 
tras tanto sólo añadiremos que ambos tensores considerados son 
univalentes ya que se determinan por sistemas de números 41, 
Ag...) On y ,2X, ..., x” que dependen de un índice. Los coeficien= 
tes de ina forma lineal, que al pasar a una base nueva se trans- 
forman igual que los vectores básicos, forman un tensor covariante, 
es decir, un tensor que se transforma igual que los vectores básicos. 
En cambio, las coordenadas de un vector ofrecen un ejemplo de un 
tensor contravariante. 

Consideremos otros dos ejemplos. 

3. Función bilineal. 

Sea A(x, y) una función bilineal ($ 2 del capítulo VI) dada en 
un espacio vectorial R de n dimensiones. Siendo x = xleye y = p*ez 
dos vectores cualesquiera de R, se tiene 


Álx, y) = A(uten y rex) =xy*Ales ex) = apxiy!, 


donde az = Ale, ex), es decir, una función bilineal A(x, y) se 
representa en una base dada es, es, ..., €, por una forma bilineal 
ayexiy* (¡sumación respecto a iy k!) en las coordenadas de los vec- 
tores x e y con los coeficientes ayy. 
Pasemos a una base nueva e;, es, 
cambio. Si x = x“ej e y = y*ej, tenemos 


Ax, y) =A(uiei, y ei) = xy Ale, 05) =a yt, (6) 








e, y sea (2) la matriz del 
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donde 


ig = Ale, es) = Aleley, ches) = clchá(es, en) = clean (1) 


Por consiguiente, una función bilineal A(x, y) se determina en 
toda base por un sistema de n* números a que dependen de dos 
índices y que, al pasar a una base nueva, se transforman según 
la ley (7), es decir, respecto a cada uno de los índices, igual que los 
vectores básicos. Este es un ejemplo de un tensor de valencia dos 
(por depender de dos Índices) covariante respecto a ambos índices 
(o doblemente covariante). 

4. Aplicación lineal. 

Todo operador lineal (aplicación lineal) ot de un espacio R de n 
dimensiones se representa en una base dada €, €z, . .., €, por una 
matriz A = [of] (también aquí el índice superior corresponde al 
número de la fila y el índice inferior, al número de la columna). Al 
pasar a una base nueva ef, es, ..., e, con la matriz del cambio C, 
la matriz A se transforma en 


CAC 


($3 del capítulo III). Veamos cómo se expresan los elementos aj! 
de la matriz C“LAC mediante los clementos af de la matriz A. El 
elemento de la p-ésima fila y de la k-ésima columna de la matriz AC 
esigual a ac]. El elemento de la i-ésima fila y de la k-ésima columna 
de la matriz C“14C es baje), es decir, 


al = baje = bb. 6) 


Por consiguiente, una aplicación lineal cf se determina en toda 
base por un sistema formado de »* números af, que dependen de 
dos Índices, el inferior y el superior, y que al pasar a una base 
nueva se transforman según la fórmula (8), es decir, igual que los 
vectores básicos en cuanto al índice inferior y con la matriz inversa 
—«contravariantemente» a los vectores básicos— en cuanto al 
índice superior. Tenemos, pues, otro ejemplo de un tensor de 
valencia dos (porque depende de dos Índices) que en este.caso resulta 
una vez covariante y una vez contrayariante (tensor bivalente mixto). 

Consideremos el tensor bivalente mixto cuyas coordenadas en 
una base fija es, és, e, se determinan por las igualdades 
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En cualquier base nueva ej, €, 
> 30,5 = Jo = 8 


Por consiguiente, las coordenadas del tensor $) son las mismas 
en todos los sistemas de coordenadas. Esto se debe a que en la base 
ipicial e,, ez, ..., €, los elementos ) forman la matriz unidad y, 
por lo tanto, el tensor correspondiente determina la aplicación 
idéntica cuya iatriz es la misma en todas las bases. 


», tenemos 


$2. Definición y propiedades elementales de un tensor 


Supongamos que en toda base de un espacio vectorial R de m 
dimensiones está dado un sistema de n**% múmeros a 
dos con q Índices superiores y con p índices inferiores que toman 
independientemente los valores 1, 2, ..., m) y supongamos que al 
pasar a una base nueva con la matriz del cambio (Q) estos números 
se transforman según la ley 


art, = clicli. - «clzbibl. de. 0) 


Diremos entonces que se tiene un tensor (p+g) -valente p veces 
covariante y q veces contravariante. Los números dist,..%, se deno- 
minan coordenadas del tensor. 

Un escalar, es decir, una magnitud que tiene el mismo valor en 
todos los sistemas de coordenadas, puede ser considerado como 
un tensor de valencia mula. 

Si las coordenadas de dos tensores de la misma estructura (es 
decir, que tienen igual número de índices covariantes y de índices 
contravariantes) coinciden en una base, está claro que coinciden en 
todas las demás (y, por consiguiente, estos tensores son iguales) ya 
que al pasar a una base nueva las coordenadas de ambos tensores 
se transforman igualmente. Por ello, para definir un tensor de una 
estructura dada es suficiente dar sus coordenadas en un sistema de 
coordenadas. Esto se puede hacer sin limitación alguna: para las 
coordenadas de un tensor en una base dada se pueden tomar núme- 
ros absolutamente arbitrarios. Efectivamente, supongamos que en 
una base ey, €s, . . ., €, se hantomado arbitrariamente n”+% números 

1-1, En otra base cualquiera las coordenadas del tensor corres- 
pondientes se determinan según la fórmula (9) y resta sólo demos- 
trar que al pasar de una base cualquiera e;, es, ..., e, a otra base 
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cualquiera el, es, ..., ex las coordenadas del tensor obtenido se 
transforman también según la fórmula (9). 

Demostremos esto en el caso de un tensor a de valencia tres. 
Supongamos que al pasar de la base e,, €, ..., €, a la base ej. 
eh -.., €, Se tiene 


é=Gén (10) 


y que al cambiar la base £,, €, - .., €, por la base ef, ex, --., € 
se tiene 


ell = The (1D 
De la igualdad (10) resulta 

blej = blcj'em = en = €x (12) 
y de la igualdad (11) 

Bei! = Entity = Vrtx = Eno (13) 


Aquí [bf] es la matriz inversa de la matriz [4] y [5x] es la matriz 
inversa de la matriz [¿(]. De las igualdades (11), (12), (10) y (13) se 
deduce que 


el =2 fe =7fble; = dlej 
y 

E = den = Bel =Jel. 

Por consiguiente, la matriz del cambio de la base ef, 6%, .... €% 
por la base ey”, es”, ..., ey esla matriz 


[a/] > [etod] 
y la inversa de ésta es la matriz 
151 = [976]. 
Tenemos 
ajo = cibrbjas (14) 


y 
ay 0 = crbnblaj. (15) 
De la igualdad (14) resulta 
Verda” = Bda = 
= (Vier) (c70?) (cba = r9r Ola = a. 
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Introduciendo este valor de az" en la igualdad (15), obtenemos 
ay = Eldar = 
= (br) (Ber) (Blc) = diff lar; 


luego, las fórmulas de transformación de las coordenadas del tensor 
al cambiar Ja base e;, es, ..., €, por la base ej”, es, ..., €, tienen 
precisamente la estructura que se requiere. En el caso general la 
demostración es análoga. De aquí se deduce que, por ejemplo, 
un tensor x' contravariante de una valencia puede ser considerado 
como el conjunto de las coordenadas de un vector. Efectivamente, 
si en una base cualquiera e, €», ..., €, tomamos el vector que 
tiene las coordenadas x!, x*, ...., x”, las coordenadas de este vector 
y del tensor dado coincidirán en todas las demás bases. Igualmente, 
todo tensor doblemente covariante ay puede ser interpretado 
como el conjunto de los coeficientes de una forma bilineal y todo 
vector bivalente mixto af como el conjunto de los elementos de la 
matriz de una aplicación lineal. 

Si las coordenadas de un tensor no varían al transponer dos 
cualesquiera de los índices del conjunto dado de los índices i,, .....,m 
(siendo todos estos Índices solamente superiores o solamente infe- 
riores), se dice que el tensor es simétrico respecto a estos Índices, 
Como ejemplo de un tensor simétrico podemos señalar el conjunto 
de los coeficientes de una forma bilineal simétrica. 

La propiedad de un tensor de ser simétrico no depende de cómo 
se escoja la base. Consideremos, por ejemplo, un tensor af de 
valencia tres y supongamos que en una base e,, €, ..., €, Se tiene 


di = a. 
En la base ej, ez, ..., €; tendremos 
al = citas 





y 
af = abia 

Reemplazando aquí a;, por a, encontraremos que 
af = abia, 


Pero la suma no depende de cómo se denote el Índice de sumación; 
por ello, reemplazando s por 1 y 1 por s, resulta 


P= cjelota = a. 
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Un tensor se llama antisimétrico respecto a unos Índices dados 
i, Jj, ..., m (solamente superiores o solamente inferiores) si sus 
coordenadas diste.:%, cambian de signo al realizar cualquier tras- 
posición de los índices dados (y conservan su valor absoluto). 
La propiedad de un tensor de ser antisimétrico respecto a un grupo 
dado de indices no depende de cómo se escoja la base. 

Como ejemplo de un tensor antisimétrico podemos señalar 
una forma bilineal antisimétrica cualquiera. 


$ 3. Operaciones con tensores 


1. Adición. Supongamos que se tienen dos tensores de una misma 
estructura: diga. 4, y 8 » La suma de estos tensores se 
define en cualquier sistema de coordenadas por la igualdad 

a = ld 
Es fácil ver que la suma de dos tensores es un tensor de la misma 
estructura. 

2. Multiplicación. Sean dados dos tensores 

A Y 
de cualesquiera estructuras. El producto de estos tensores en cual- 
quier base se define como el conjunto de los n++2+*+" números 








Demostremos que el producto de dos tensores es también un tensor 
(en nuestro caso, (p-+q-+7+s5)-valente, p-+s veces covariante y q+r 
veces contravariante). Efectivamente, en una base nueva tenemos 


= cla» DD Dia: 





AR 
por esto 


Fin 










DST AA 
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La operación de multiplicación de tensores no es conmutativa. 
Consideremos, por ejemplo, el producto de dos tensores univalentes 
covariantes para n = 2. Sean a,, az las coordenadas de uno y ba, ba 
las coordenadas del otro. El producto cy; = a/b, es un tensor do- 
blemente covariante de coordenadas 


eu=ab, cu=ab, ca=0b y cm = aba 


El producto de estos mismos tensores tomados en el orden con- 
trario es un tensor dx = haz doblemente covariante de coordena- 
das 


di = bias, die =bi0), da =bx01 y den = bea. 


Este tensor difiere, en general, del primero. 

Puesto que un escalar, es decir, una magnitud que tiene el 
mismo valor en todos los sistemas de coordenadas, es un tensor de 
valencia nula, resulta que al multiplicar un tensor por un escalar 
(es decir, al multiplicar por este escalar todas las coordenadas del 
tensor) se obtiene un tensor de la misma estructura. 

La sustracción de tensores de una misma estructura se reduce 
a la multiplicación del sustraendo por —1 y a la adición (y se ob- 
tiene, obviamente, un tensor de esta misma estructura). 

3. Contracción de un tensor. 

Esta operacian es específica para los tensores y se define del 
modo siguiente. Sea dado, por ejemplo, el tensor a%. Tomemos 
en él dos índices cualesquiera, digamos j y p (uno arriba y el otro 
abajo), escojamos entre todas las coordenadas del tensor aquellas 
en las cuales estos índices coinciden y sumemos todas estas coorde- 
nadas. Obtendremos 


Alia = Cat Uag => E iiag = Di 


que es la contracción del tensor a?,,, respecto a los índices j y p. 
Por ejemplo, el tensor af, tiene para n = 2 ocho coordenadas 
Aly, Aly, Ah, Aza, (51, Aja, 2, y 2. Contrayendo este tensor respecto 
a los Índices i y j, obtenemos 
Ah = De 


o detalladamente: b, = dL +4%,, da = ah +d. 
Contrayendo este mismo tensor respecto a los índices i y k, 
obtenemos a), = c;, es decir, 


= 0 +Aa, Ca = Ohio. 


242 Cap. IX. Noción de tensor 





Consideremos un ejemplo más. Contrayendo el tensor afin 
(para n = 2) respecto a los índices j y 1, obtenemos ocho valores 
Blom = Am O más detalladamente 

bh =adib+ai, bh =ah+ajk, 

bh =Ah tag, bh =dh tab, 

= ta, Di = Ata, 

A = dto, dh = ra. 

Demostremos que la contracción de un tensor conduce de nuevo 
a un tensor que tiene, en comparación con el tensor inicial, un Índice 
inferior y un Índice superior de menos. Realicemos, por ejemplo, 
la contracción del tensor al, respecto a los índices j y p. Sea 
Gli = Gt, En una base nueva las coordenadas del tensor inicia] 
son 

a cal. 

Escogiendo las coordenadas para las cuales  = p y sumándolas 
respecto aj = 1,2, ..., n, obtenemos 

A = dl, abel. 

Pero cjbj = d; y Ójaf, = af, =%,. Luego, 

Ona = Ceiba, 

En el caso general la demostración es análoga. 

La operación de contracción puede ser aplicada a un tensor 
varias veces. Por ejemplo, contrayendo el tensor al% (para n = 2) 
respecto a los índices i y q y respecto a los índices k y p, obtenemos 
el tensor dí = aff; o más detalladamente: 

ds ala a, 

d= apa ae, 

ds aba, 

Es aaa ra. 

Contrayendo p veces un tensor p veces covariante y p veces contra- 
variante, obtendremos, obviamente, un escalar (invariante), es decir, 
una magnitud que no depende de cómo se escoja la base. En esto 
consiste uno de los métodos para obtener invariantes numéricos. 
Por ejemplo, contrayendo el tensor 4) que determina una aplicación 
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lineal o, obtenemos el invariante af llamado traza de la aplicación 
(at es la suma de los elementos de la diagonal principal de la matriz 
A; en el $ 7 del capítulo 111 hemos demostrado que esta suma 
invariante: al es el coeficiente de 2%=* en el polinomio característico 
da la aplicación A). 

Frecuentemente la operación de contacciónse aplica al producto 
de dos tensores tomando los índices en diferentes factores. Si el 
producto de los tensores aj y ff se contrae respecto a los índices 
3 y h, diremos simplemente que los tensores a) y Pl se contraen 
respecto a los índices j y h. Por ejemplo, contrayendo un tensor a; 
que define una función lineal f(x)) con un vectorx = (xl, 22, ..., 
x"), se obtiene el escalar a,x' igual, obviamente, a f(x). 

Contrayendo dos veces un tensor ay, —que determina una 
función bilineal A(x, y)— con un par de vectores x =(xl, x%, ..., 
x) e y =(pL, y, ..., y”), obtenemos el escalar ayx'»! igual al 
valor de la función A(x, y) para los vectores dados x e y. 

Contrayendo un tensor a) —que determina una aplicación lineal 
A—con un vector x = (xl, x?, ..., x”), obtenemos el tensor contra- 
variante y! = afx/ que, según hemos visto en el$ 1 del capítulo III, 
es el vector transformado otx (la imagen del vector x en la aplica- 
ción of) dado por sus coordenadas y”. 

Sean od y Bf dos tensores que determinan las aplicaciones linea- 
les ot y $ respectivamente. Contrayéndolos respecto a los índices 
y h, obtenemos el tensor bivalente mixto dl =ajBl que determina, 
por consiguiente, una aplicación lineal /D. Es fácil ver que la aplica- 
ción D esigual al producto otB de las aplicaciones Ak y B (en el 
sentido del $2 del capítulo II). La contracción aj8f de estos 
mismos tensores respecto a los Índices i y k corresponde al producto 
BA de estas mismas aplicaciones tomadas en el orden contrario. 

4. Simetrización y alternación de un tensor. 

Sea Aj,1,...1, Un tensor cualquiera en el que se han escogido unos 
Kíndices lx, los - »-, lx, todos ellos solamente superiores o solamente 
inferiores. El tensor 


Als) Alzccciao 

de o» PA 

donde la suma se extiende a todas las permutaciones posibles í1, 
la, . . ., 1: de los indices escogidos, es, obviamente, simétrico mientras 
que el tensor 


Agoda = And A 
A cd ij 
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es antisimétrico. Las operaciones consistentes en pasar de un tensor 
dado Aqui...) 2 los. tensores At...) Y Áyt,....yy Se denominan 
simetrización y alternación, ivamente. 

Por ejemplo, en la pág. 169 las funciones bilineales B(x, y) y 
C(x, y) han sido obtenidas simetrizando y alternando, respectiva- 
mente, la función bilineal A(x, y). 





$ 4. Tensores en un espacio euclídeo 


Supongamos ahora que R es un espacio n-dimensional euclídeo, 
Por supuesto, en este caso se conserva tódo cuanto hemos dicho 
acerca de los tensores en un espacio lineal cualquiera. Pero en el 
espacio euclídeo los tensores poseen algunas propiedades nuevas. 

Para cualesquiera dos vectores x e y de un espacio euclídeo R 
está definido el producto escalar (x, y) que es una función bilineal 
simétrica y que en una base dada e,, €», ...., €, queda representado 
por la forma bilineal simétrica 


(y) = gux!, 


donde gu = (es, ex). Las magnitudes g;,, tomadas en todos los 
sistemas de coordenadas, forman como hemos visto en el $ 1 un 
tensor doblemente covariante que se denomina tensor métrico del 
espacio R. 

La contracción del tensor métrico gy con un vector x = (x, 
Pero 000), 

x= gux* (16) 
es un tensor univalente covariante. Los números x, también carac- 
terizan al vector x, es decir, en cierto sentido son también coorde- 
nadas de éste; se pueden llamar coordenadas covariantes del vector 
x a diferencia de sus coordenadas contravariantes x'. Busquemos 
la interpretación geométrica de las coordenadas covariantes. 
Puesto que 

x= gu = (e, 01) x= (e), e4x) = (04 2), 
resulta que las coordenadas covariantes x, son las proyecciones del 
vector x sobre los vectores básicos. (Recordemos que las coordena- 
das contravariantes de un vector x son los coeficientes de su desa- 
rrollo 


x= xej 
respecto a la base ey, €2, ..., €). 
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En una base ortonormal se tiene 
Ll osii=k, 
O si ik, 


y, por consiguiente, xy = x!, es decir, las coordenadas covariantes 
y Contravariantes de un vector coinciden. 

La contracción doble gix!y* del tensor métrico g;x con los 
vectores x= (21,7, ...,x ey =(9, y, ..., y”) es el producto 
escalar (x, y); la contracción doble gyx!x* del tensor con el vector 
x es el cuadrado escalar (x, x) del vector x. 

El determinante |gu] de la matriz [gn] es diferente de cero. 
Efectivamente, al pasar a una base nueva el rango de la matriz de 
una forma bilineal, en particular, el rango de la matriz [g.x), no 
varía. Pero en una base ortonormal (g.] es la matriz unidad y su 
determinante es igual a la unidad; luego, el determinante de la 
matriz [g,x] es diferente de cero también en todas las demás bases. 

Sea [g'*] la matriz inversa de la matriz [g] en una base deter- 
minada e, €2, . .., €4. En este caso tenemos g'%g,, = Ó) para todos 
los i,j = 1,2, ...,n. Formemos el tensor doblemente contravariante 
cuyas coordenadas en la base e, e, ...., e, son iguales a g'%; las 
coordenadas de este tensor en todas las demás bases se determina: 
rán entonces por la fórmula (9). En toda base nueva ef, ez, ..., €; 
tendremos (tomando en consideración el carácter tensorial de las 
operaciones de multiplicación y de contracción) 

g gy =0/=08), 
es decir, en todos los sistemas de coordenadas las coordenadas del 
tensor g'* forman la matriz inversa de la matriz [g1). El tensor g* 
se denomina tensor métrico contravariante. 

El paso de las coordenadas contravariantes de un vector a sus 
coordenadas covariantes según la fórmula (16) puede ser denomi- 
nado operación de descenso del índice. Para elevar el indice, es decir, 
para pasar de las coordenadas covariantes de un vector a sus 
Coordenadas contravariantes, multipliquemos por g// ambos miem- 
bros de la igualdad (16) (sumando, claro está, respecto a ¿); tendre- 
mos 


glixs = glignok = dxk = xo, 


En un espacio euclídeo la operación de descenso o de elevación 
del índice (que lleva el expresivo nombre de la operación malabárica) 
se puede aplicar a un tensor de cualquier estructura. Sea dado, por 


Eu =(e1 e) = 
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ejemplo, un tensor 4% de valencia tres, una vez covariante y dos 
veces contravariante. Su contracción 


Ea, = (17) 


con el tensor métrico será un tensor dos veces covariante y una vez 
contravariante. La contracción 


Ene = Bos (18) 
será tres veces covariante y la contracción 
gUal = y (19) 


será, al contrario, un tensor tres veces contravariante. Si ambas 
bases €1, €2, - .-, €n Y €, €2, - .., €, son ortonormales, tenemos 


opel si 1=% 

ERE (o si i2k, 

y las igualdades (17), (18) y (19) dan sucesivamente 
all = af, (17) 
Ae = Bon (18) 
aq =y0, (19) 


de donde cambiando la denotación del índice de la sumación obte- 
nemos 


al = ale = Be = Yu 


En este caso los índices covariantes y contravariantes se portan, 
al pasar a una base nueva, igualmente y la ley de la transformación 
del tensor queda determinada exclusivamente por su valencia. 

Este último resultado puede explicarse también de la forma 
siguiente. Siambas bases €, €2, . . .. €n Y 6, €2, » »., €4 SON OTtONOr- 
males, la matriz C del cambio de la primera base por la segunda 
es ortogonal, es decir, 


Cca=cC”. 
Pero en este caso resulta bf = cf y en la fórmula (9) para la trans- 
formación, por ejemplo, del tensor af 


all = cfelblaz, 
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podemos sustituir uno o ambos b E e o, al contrario, sustituir c 
por b, Por ejemplo, sustituyendo b,, por cf, obtenemos 


atole. 


Aguí hemos tenido que emplear el signo de la suma $ 


porque el índice q, respecto al cual se realiza la sumación, $ aparece 
dos veces arriba. Poniendo af =a7,, encontramos la ley de la 
transformación de «/, en la forma 


ol = ccfljo, = cba, 


es decir, el tensor af, es dos veces covariante y una vezcontravarián- 
te. Pero sus coordenadas en ambas bases son iguales a las coorde- 
nadas respectivas del tensor a una vez covariante y dos veces 
contravariante. 

Por ejemplo, hemos visto ($ 6 del capítulo VI) que al cambiar 
una base ortonormal por otra la matriz de una forma bilineal (que 
es un tensor dos veces covariante) y la matriz de una aplicación 
lineal (que es un tensor una vez covariante y una vez contravarian- 
te) se transforman idénticamente, 





a 


CAPÍTULO X 


CONCEPTOS PRINCIPALES DE LA TEORIA DE GRUPOS 


$ 1. Ejemplos de grupos. Definición de un grupo 


Consideremos el conjunto de todos los números enteros. Al sumar 
dos números enteros obtenemos de nuevo un número entero, Si 
uno de los sumandos es igual al número (entero) O, la suma es igual 
al segundo sumando: a+-0 = a; para todo número entero a existe 
el número (entero) —-a, llamado opuesto de a, tal que su suma con 
a da 0. La operación de adición de números es, como se sabe, con- 
muta (a+b = b4a para dos números a y b cualesquiera) y 
asociativa ((a+b)+c =a+(b+e) para tres números a, b y € 
cualesquiera). a 

En el conjunto de todos los números enteros, el subconjunto de 
todos los números divisibles por un múmero dado k posee estas 
mismas propiedades: es cerrado respecto a la operación de adición 
(la suma de dos números cualesquiera divisibles por k es divisible 
por k); contiene el O (el cero es divisible por un número cualquiera); 
si a es divisible por k, también —a es divisible por k. 

Propiedades análogas se cumplen en el conjunto de todos los 
números racionales, en el conjunto de todos los mímeros reales y en 
el conjunto de todos los números complejos: cada uno de estos Con- 
juntos es cerrado respecto a la operación de adición; el cero es a 
la vez un número racional, rea! y complejo; para todo. número com- 
plejo a existe su opuesto —a que es real, si a es real, y es racional, 
si a es racional. 

Enel conjunto de los números complejos (y,como consecuencia, 
también en el conjunto de los números reales y en el conjunto de 
los números racionales) la operación de adición es conmutativa y 
as Todos estos casos son ejemplos de «grupos respecto a 
la 








Consideremos ahora el conjunto de todos los números reales 


$ 1. Ejemplos de grupos. Definición de un grupo 249 





diferentes de cero. El producto de dos números así es de nuevo un 
número diferente de cero; el producto de cualquier número a por el 
número Í (real y diferente de cero) es igual a a; paratodo número 
real a (¡diferente de cero!) existe el número inverso real a“l 
(también diferente de cero) tal que su producto por aesiguala 1. 

Propiedades análogas las posee el conjunto de todos los números 
racionales diferentes de cero, el conjunto de todos los números reales 
positivos o el conjunto de todos los números racionales positivos, así 
como el conjunto de todos los números complejos diferentes de cero 
o. el conjunto de todos los números complejos de módulo igual a 1. 
Cada uno de estos conjuntos es cerrado respecto a la operación de 
multiplicación, todos ellos contienen la unidad y para todo ele- 
mento de estos conjuntos existe el elemento inverso que pertenece 
al mismo conjunto. La multiplicación de los números complejos 
(y, por consiguiente, también de los números reales y racionales) es 
conmutativa (ab = ba para todos los a y b) y asociativa ((ab)c = a(be) 
para todos los a, b y €). 

Todos estos casos son ejemplos de «grupos respecto a la multl- 
plicacióm». Podemos indicar un ejemplo menos esperado: forman un 
grupo respecto a la multiplicación, por ejemplo, los números 1 
y —1. Dicho sea de paso, el conjunto formado solamente por el 
número 1 (o por el número 0) también constituye un grupo respecto 
a la multiplicación (a la adición, respectivamente). 

Es obvio que los números complejos 1, i, —1 y —i también 
forman un grupo respecto a la multiplicación. 

Pero, además de los números, se pueden sumar también los 
vectores de un espacio lineal R y esta operación de adición verifica 
las mismas leyes que la adición de los números: es conmutativa y 
asociativa, en R existe el elemento 0 tal que x+-0 = x para todo 
x € R y Cualquiera que sea el vector x € R existe el vector opuesto 
—x tal que x+(—x) = 0. 

También se pueden sumar las matrices de una misma estructura, 
es decir, las (m Xm]-matrices. Esta operación de adición es asocia- 
tiva y conmutativa, existe la matriz nula que es la matriz formada 
por ceros solamente y para toda matriz [a] existe la matriz 
opuesta [—a] tal que [1] +[-ax] es la matriz nula. Si se con- 
sideran solamente las matrices de elementos enteros ay, la suma 
será una matriz del mismo tipo, los elementos de la matriz nula 
serán números enteros y para toda matriz de elementos enteros la 
opuesta será también una matriz de elementos enteros, Todos estos 
casos son ejemplos de grupos respecto a la adición. 
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Por otro lado, además de los números, se pueden multiplicar, 
por ejemplo, las matrices cuadradas no degeneradas de un mismo 
orden n con elementos reales (solamente racionales o, al contrario, 
solamente complejos). El producto de dos matrices así será también 
una matriz no degenerada (teorema 3 del capítulo II) de elementos 
reales (racionales o complejos, respectivamente); la matriz unidad 
es no degenerada y para toda matriz no degenerada existe la matriz 
inversa (también no degenerada y también de elementos reales, 
racionales o complejos, respectivamente). El producto de matrices 
es asociativo pero no es conmutativo. El conjunto de todas las 
matrices no degeneradas de orden n de elementos reales (racionales 
o complejos) ofrece un ejemplo de un grupo no conmutativo 
respecto a la multiplicación. 

Demos ahora la definición general de un grupo. 

Definición 1. Se llama grupo a un conjunto G de elementos 

b, ... parallos que está definida una operación algebraica (denomi- 

nada comúnmente multiplicación o adición) que a todo par ordenado 
de elementos a, b de G pone en correspondencia un tercer elemento 
e = aob con la particularidad de que se cumplen las condiciones 
siguientes: 

1, Esta operación es asociativa: para cualesquiera tres elementos 
a, b y c de G se tiene 


(aobjoc = ao(boc); 


2. En G existe el elemento «neutro» e tal que 

a0e=e04= 
pará todo a de G; 

3. Para todo elemento a de G existe el elemento «inverso» a“1 
tal que 

ascarizatoa=e. 

El grupo se llama conmutativo o abeliano si sé cumple, además, 
la ley conmutativa: 

4, Para cualesquiera dos elementos a, b € G se tiene 

aob= boa. 


El grupo se llama finito si consta de un número finito de elementos. 
El múmero de elementos de un grupo finito se denomina orden del 
mismo, Todo grupo que no sea finito se llama infinito. 
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En el caso en el que la «operación de grupo» ob se denomina 
adición y se indica porel signo +, el grupo G se llama grupo respecto 
a la adición o grupo aditivo. En este caso el «elemento neutro» e se 
indica frecuentemente con el símbolo O y se Mama cero, mientras 
que el elemento inverso de a se designa por —a y se denomina 
opuesto de a. En el caso en el que la «operación de grupo» se 
denomine multiplicación, en lugar de ao b se escribe ab, el grupo se 
llama grupo respecto a la multiplicación o grupo multiplicativo y el 
elemento neutro e se denota a veces simplemente por 1 y se deno- 
mina unidad. 

Basándose en la ley asociativa, se puede definir el producto (la 
suma) de tres o de un número mayor de elementos del grupo. Puesto 
que (ab) = a(bc), tiene sentido hablar simplemente del producto 
abc de tres elementos tomándolo, por definición, igual a (ab)c = 
= a(bc). Igual que en el caso de los espacios lineales, se puede 
demostrar que el elemento unidad (el elemento nulo) de un grupo es 
único y que el elemento inverso (opuesto) de un elemento dado es 
único. 

Es fácil ver que en todo grupo (digamos, multiplicativo) tienen 
solución única las ecuaciones 


ax=b 

(cuya solución es, obviamente, x = a71b) y 
ya=b 

(para la que se tiene y = ba”*). 


$2. Grupos de transformaciones 


Una clase importante de grupos forman los grupos de trans- 
formaciones. Sea M un conjunto cualquiera. Se/lama transformación 
del conjunto M a toda aplicación biyectiva P de este conjunto sobre sí 
mismo. Esto significa que para todo elemento x de M está definida 
univocamente su imagen Px=x"€M y que, además, todo 
elemento x' de M es la imagen de un elemento único x denominado 
imagen recíproca de x. 

Lamultiplicación de las transformaciones consiste en la realización 
consecutiva de las mismas, es decir, se toma por definición que 


(PQ)x = H0%). 


se 
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La multiplicación de las transformaciones es una operación asociativa 
—esto se puede demostrar igual que en el caso de las aplicaciones 
lineales ($ 2 del capítulo KI) — pero no es, en general, una operación 
conmutativa (la propia multiplicación de las aplicaciones lineales 
es ya no conmutativa). El papel de la unidad lo desempeña en este 
caso la transformación idéntica E que a todo elemento x de M le 
pone en correspondencia este mismo elemento. Para toda transfor- 
mación P del conjunto M existe la transformación inversa P-1 que 
a todo elemento x” de M pone en correspondencia su imagen 
recíproca x (única por hipótesis); es obvio que 
PP PP SE. 


Si el conjunto M es finito y consta de n elementos, todas las 
aplicaciones biyectivas posibles de este conjunto sobre sí.mismo se 
denominan sustituciones, el grupo de transformaciones correspon- 
diente se indica por S, y se denomina grupo de sustituciones de n 
elementos o grupo simétrico de orden n. 

Consideremos más detalladamente el grupo simétrico de orden 
tres Sy, es decir, el grupo formado por todas las aplicaciones 
biyectivas del conjunto compuesto de tres elementos a, b y c sobre 
sí mismo. Con tres elementos se puede formar un total de seis 
permutaciones diferentes 

abc, acb, bac, bca, cab y cba; 


luego, el número de distintas sustituciones de este conjunto es 
también igual a seis. Resulta cómodo indicarlas por 


a b a ba a bo 
»- , hn , P =( 
ú c b ) ( Cc :) s b a 
Pe b % 2=(z b % Pa=(: b 5» 
b a c ca e a b 
donde, por ejemplo, ($. a e) es aqucia aplicación del conjunto 
a, b y e sobre sí mismo para la que a -- 5 (ase trensforma en b), 
b -» c y c -- a. Nose consideran distintas las sustituciones que 


difieren sólo en el orden de secuencia de las columnas como son, 
por ejemplo, 


AER, 
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La multiplicación de las sustituciones consiste en la realización 
sucesiva de las mismas; por ello se tiene, por ejemplo , 


Pare= (e b ( b =( b 7-2 
e a bla cb, e b aj 


ya que en el primer factor a + a, en el segundo a => c y, por con- 
siguiente, en el producto a — c, etc. En esta multiplicación la 
unidad es la sustitución idéntica 


a be 
P= 
ss ( b ) 
y para toda sustitución existe la inversa 


PS Par =P Pt=P Ri, y im Re 


Para obtener la sustitución inversa de una dada basta cambiar 
entre sí sus filas 


pea e 
e 2) a b ) ca ) 

El grupo $, puede ser representado por Ja siguiente tabla de 
multiplicación 














donde en la columna de la izquierda aparecen los segundos factores 
P,, en la fila superior aparecen los primeros factores P, y en el 
cruce de las filas y de las columnas correspondientes figuran los 
productos P,P4 de estos factores. Estas tablas se llaman tablas de 
Cayley. Es fácil ver que cada uno de los elementos aparece sólo una 
vez en toda fila y en toda columna de la tabla de Cayley (ya que 
multiplicando a la izquierda por P/* la igualdad P.P, = PP, se 
obtiene P, = Pa y de la igualdad P/P, = PxP, resulta que P, = Px). 
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e 


A Fig. 28 


El grupo 53 no es conmutativo, ya que, por ejemplo, 

PiPs =Pa y PsPi=Ps 
(la tabla de Cayley de este grupo no es simétrica respecto a la 
diagonal principal). 

Otro ejemplo importante de un grupo de transformaciones es 
el grupo de las rotaciones de un polígono regular de n lados. Sea 
ArAz.. . An un polígono regular y sea O su centro. Consideremos el 
conjunto de todas las rotaciones posibles del plano alrededor del 
punto O que hacen coincidir este polígono con sí mismo. Es obvio 
que existen n rotaciones de este tipo: 

o, la rotación de ángulo 0 e transformación idéntica), 


1, la rotación de ángulo E 


a, la rotación de ángulo 22 





4-1, la rotación de dogalo 22 (1 EN 


La multiplicación de las rotaciones consiste en la realización 
sucesiva de las mismas: 
Ag:01 = 041 
aceptándose, claro está, que a, = %o y que G,++ ='az. La rotación 
2 s el elemento unidad del grupo y 2zl == dr 1. 
Consideremos un ejemplo más:.el grupo de superposiciones o 
el grupo simétrico de un romibo. Sea ABCD un rómbo (fig: 28). 
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Consideremos las siguientes tsaneformáciooss que sobreponen este 
rombo sobre sí mismo: 

b1, la transformación idéntica; 

ba, la simetría respecto a la diagonal AC; 

Ba, la simetría respecto a la diagonal BD; 

ba, la simetría respecto al centro O. 

El producto de dos cualesquiera de estas transformaciones es de 
nuevo una de ellas. Estas transformaciones forman un grupo con 
la siguiente tabla de Cayley 





$3. Subgrupo 


Definición 2. Se llama subgrupo de un grupo G a un conjunto 
Gi de elementos del grupo G que constituye él mismo un grupo respecto 
a la operación definida en el grupo G. 

, el grupo aditivo dé los números reales contiene el subgrupo 
de los números enteros y éste contiene los subgrupos de los números 
múltiplos de k cualquiera que sea k. El propio grupo de Jos números 
reales es un subgrupo del grupo de los números complejos. 

El grupo multiplicativo de los números complejos diferentes de 
cero contiene el subgrupo de los números reales y éste contiene el 
subgrupo de los números racionales y el subgrupo de los números 
reales positivos. 

Varios subgrupos interesantes contiene el grupo multiplicativo 
de.las matrices no degeneradas de orden » (grupo lineal completo) 
formadas, por ejemplo, por elementos reales. Señalemos, en particu- 
lar, el subgrupo de las matrices ortogonales y el subgrupo de las 
matrices unimodulares (es decir, de matrices de determinante igual a 
1). También son subgrupos del grupo lineal completo el grupo de 
las matrices de determinante igual a +1, el grupo de las matrices 
de determinante positivo, el grupo de las matrices diagonales, el 
grupo de las matrices escalares (es decir, de matrices de tipo cE, 
donde ces un número cualquiera y E es la matriz unidad), el grupo 
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de las matrices triangulares (es decir, de las matrices en las que son 
iguales a cero todos los elementos que aparecen por encima (por 
debajo) de la diagonal principal), etc. 

Para comprobar que un subconjunto G, de un grupo G es 
un subgrupo de este último es necesario comprobar que el pro- 
ducto (la suma) de dos cualesquiera elementos de G, pertenece a 
G, y que si a€ G,, también a”2€ G;. Pero esto resulta también 
suficiente, ya que la ley asociativa se cumplirá para los elementos de 
Gi por ser válida en todo el grupo G y el elemento e pertenecerá a 
G, por ser igual al producto aa”! (o a la suma a+(—a)). Está claro 
que un subgrupo de un grupo conmutativo será siempre conmutativo. 

Es fácil concebir que /a intersección de dos subgrupos de un 
grupo G es un subgrupo de G. 

Así, en el grupo aditivo de los números enteros la intersección 
del subgrupo de los números múltiplos de tres y del subgrupo de los 
números múltiplos de dos es el subgrupo de los números múltiplos 
de seis. 

Todo grupo tiene el subgrupo formado solamente por la unidad 
(el cero) y todo grupo es subgrupo de sí mismo. (Estos subgrupos 
se denominan impropios.) 


$ 4. Isomorfismo de grupos 


El grupo simétrico de tercer orden Sy tiene tres subgrupos de 
segundo orden: (Pa, Pa), (Pa, Pa) y (Pw, Py) con las tablas de Cayley 











que considerados independientemente del grupo Sy difieren uno 
del otro sólo en lá designación de los elementos. 

El grupo simétrico Sy tiene un subgrupo A de tercer orden 
(Pa, Po, Po) con la tabla de Cayley 
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Comparémoslo con el grupo de rotaciones de un triángulo regular 





Estos grupos también difieren sólo en la denotación de los 
elementos. Se dice que estos grupos son isomorfos. 

Definición 3. Dos grupos G, y Ga se llaman isomorfos si entre sus 
elementos se puede establecer una correspondencia biyectiva que 
conserve la operación de grupo, es decir, en la que para 


MYLEG1 y XY2€ Go 


y 
Xi Ys X= Ya, 


se tenga 
X1O )] +» X20 Ya. 


Se puede demostrar que todos los grupos de orden dos (así como 
todos los grupos de orden tres) son isomiorfos entre sí. Pero para el 
caso de órden cuatro existen ya dos grupos no isomorfos: el grupo 
de rotaciones del cuadrado y el grupo simétrico del rombo. 

Todo grupo isomorfo al grupo de rotaciones de un polígono 
regular de n lados se llama grupo cíclio de orden n; este grupo está 
compuesto por las potencias de uno de sus elementos: e, a, al, ..., 
a”-1. Todo grupo 'isomorfo al grupo aditivo de los números enteros 
se llama grupo cíclico infinito; este grupo también resulta generado 
por uno de sus elementos 


2=14+1, 3=14+1+1, etc. 





Observemos que las operaciones de grupos isomorfos pueden 
estar indicadas de distinta forma. Así, el grupo multiplicativo de 
los números positivos es isomorfo al grupo aditivo de los números 
reales. La correspondencia isomorfa entre estos grupos es la 
aplicación 


ana. 
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$ 5. Grupos de transformaciones de un plano 


Consideremos ahora algunos grupos de transformaciones de un 
plano (euclídeo). 

1. Movimientos. 

Definición 4. Se llama movimiento a toda transformación (de un 
conjunto de puntos) de un espacio euclídeo (de un plano, en particu- 
lar) que conserva la distancia entre los puntos: si el punto A se 
transforma en A' (en este caso escribiremos A — A) y B= B', 
la longitud del segmento A'B' es igual a la longitud del segmento AB. 

Estas transformaciones constituyen un grupo: si dos transfor- 
maciones no alteran las distancias entre los puntos, el producto de 
éstas posee la misma propiedad; la transformación idéntica que 
no varía la posición de ninguno de los puntos es un movimiento 
y la transformación inversa de un movimiento es, por supuesto, 
un movimiento. 

En el grupo de los movimientos se destaca el subgrupo de las 
traslaciones paralelas que se define como sigue. Sea dado un vector 
a; se llama traslación paralela de vector a a la transformación Ta 
que a todo punto A del plano le pone en correspondencia el punto 
A' tal que el vector A4' es igual a a. Esta transformación es un 
movimiento: si A» A' y B—=,B', se tiene A4' = a y BB" = a; 
luego, el cuadrilátero 44'B'B es un paralelogramo y, por cónsi- 
guiente, A'B' = AB ((ig.29). El producto T,T+ de dos traslaciones 
paralelas de vectores a y b es la traslación paralela 7,4 (de vector 
a+b) y la transformación inversa de la traslación paralela T, es la 
traslación paralela T... (de vector —a). 

Por consiguiente,. todas las traslaciones paralelas T de un plano 
forman un grupo que es un subgrupo del grupo de los movimientos. 
De lo expuesto se deduce que este grupo es isomorfo al grupo 
(respecto a la adición) de los vectores de un plano. Sien la traslación 
paralela de vector a = (41, as) el punto o A(x, y)'se transforma en el 
punto A'(x, y”), resulta que el vector 44” = a, es decir, que (Y —x, 
Y —y) = (41, aa) y, por consiguiente, 


XRO) YY =0%, 
es decir, 

Y =x+0 

Y =y+w%. 
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B a B' 


A a A Fig. 29 


Consideremos, por otro lado, todos las movimientos posibles de 
un plano que conservan la posición de un punto determinado O; es 
obvio que también constituyen un subgrupo del grupo de los movi- 
mientos del plano. 

Sea H un movimiento cualquiera de punto fijo O. Indiquemos 
por % la correspondiente aplicación del espacio vectorial, es decir, 
la aplicación en la que el vector OA se transforma en el vector 
OA, donde A' es la imagen del punto A en la transformación H. 
Demostremos que % es una aplicación lineal. 

1. Supongamos que A — A' y B => B'; supongamos, además, 
que 

0C =04+0B 
y que C > C' (fig. 30, a). Tenemos B'C' = BC (por ser H un 
movimiento), BC = OA (porque OBCA es un paralelogramo) y 
OA =04' (porque H es un movimiento). Luego, B'C' = 04". 
Análogamente resulta 

4C' = AC =0B=0B' 


y, por consiguiente, A'C' = OB'. De aquí se deduce que el cua- 
drilátero OA'C'B' es un paralelogramo y, por ello, 


0C' = 04'+0B", 
es decir, si 

0A-04' y OB- OB, 
resulta que 


OA+0B -- DA'+0B". 
2. Supongamos que A — A' y B — B', donde 
OB =204 
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a) 
Fig. 30 


(fig. 30, b). Puesto que los puntos O, A y B son colincales, de las 
igualadades 

04'=04, 0B'=0B y AB'=AB 
resulta entonces que los puntos O, A' y B' son también colineales 
y están situados en el mismo orden que los puntos O, Á y B;como, 
además, 

OB' =0B = |a|-0A =|a1:04, 
tenemos 

OB =204. 

Es decir, 

si OA > DA, resulta quea0A —- «04. 

La aplicación lineal 2 no altera las longitudes de los vectores y, 
por consiguiente, es una aplicación ortogonal, es decir, o bien una 
rotación alrededor del punto O o bien una simetria respecto a un eje 
que pasa por el punto O ($ 3 del capítulo V). La transformación 
(puntual) H tiene este mismo carácter y también puede ser denomi- 
nada ortogonal. 

Sea ahora Q un movimiento cualquiera. Tomemos en el plano 
un sistema cartesiano rectangular de coordenadas; sea O su origen 
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y sea O" la imagen del punto O en la transformación O, El producto 
H =To'0 0% del movimiento Q por la traslación paralela To:o será 
un movimiento de punto fijo O. Por consiguiente, H es una trans- 
formación ortogonal, es decir, o bien una rotación alrededor del 


punto O o bien una simetría respecto a una recta que pasa por el 
punto O. Pero en este caso tenemos 


Q =Too H. 


Hemos demostrado que todo movimiento puede ser representado 
como el producto de una transformación ortogonal (es decir, de una 
rotación alrededor de un punto o de una Simetría axial) y de una 
traslación paralela, 

2. Transformaciones de semejanza. 

Definición 5. Se llama transformación de semejanza de un coefi- 
ciente dado k > 0 a la transformación de un espacio euclídeo, en 
particular de un plano, en la que las longitudes de todos los segmentos 
se multiplican por un mismo número k: si A => A! y B + B', se tiene 
AB'=kAB. 

Todas las transformaciones de semejanza de un plano constituyen, 
obviamente, un grupo que contiene como subgrupo al grupo de los 
movimientos. 

Una transformación de semejanza que en un sistema determinado 
de coordenadas tiene la forma A(x, y) > 4A'(x', Y), donde 


x=kx, y =ky (k% 0), 0) 


se denomina homotecia de centro en el origen de este sistema y de 
razón k. Toda transformación de semejanza R con el punto fijo O 
determina en el espacio vectorial correspondiente una aplicación 
lineal (esto se comprueba igual que en el caso de los movimientos). 
Supongamos que en la transformación de semejanza R (de punto 
fijo O) las longitudes de todos los segmentos se multiplican por k. 
Tomemos un sistema de coordenadas de origen en el punto O 
e indiquemos por K la transformación (1). En estas condiciones la 
transformación H = K-1Rnoaltera las longitudes de los segmentos 


» Recordamos que el producto de estas transformaciones se lee de derecha 
a izquierda, es decir, primero se realiza la transformación Q y después la trasla- 
ción paralela Too de vector 00. 

7 Se puede demostrar que el producto de una rotación y de una traslación 
paralela es una rotación alrededor de un punto nuevo. 
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y, por consiguiente, es una transformación ortogonal, es decir, una 
Totación o una simetría. Pero entonces R = KH; luego, una trans- 
formación de semejanza de punto fijo O (transformación de seme- 
Janza con centro) es el producto de una transformación ortogonal 
y de una homotecia de centro en el punto O. 

Sea ahora U una transformación de semejanza cualquiera que 
transforma el origen de coordenadas O en el punto O”. El producto 
Too U será entonces una transformación de semejanza de punto 
fijo O, es decir, será el producto de una transformación ortogonal 
y de una homotecia: 

To:0U = KH, 
de donde resulta 

U =Tow'KH. 


Hemos demostrado que toda transformación de semejanza €s 
o bien el producto de una rotación alrededor de un punto, de una 
homotecia y de una traslación paralela o bien el producto de una sime- 
tría axial, de una homotecia y de una traslación paralela. En forma 
coordenada 


x' =kcos p»x—k sen p-) +41, 
y =ksen p-x+kcosp-y+0% 
0, en un sistema nueyo de coordenadas, 
x =kx+41, 
y =-ky+00. 


3, Transformaciones afines. 

Supongamos que en un plano afín se ha escogido un sistema de 
coordenadas. Consideremos la transformación de este plano en la * 
que el punto A(x, y) se transforma en un punto 4'(x”, y) tal que 

X= 0px ++, 

Y = 09x+ Oy +, a) 
donde 


a 4 
O 


0. 








Esta transformación se denomina «fín. 
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De la condición ¿ * O se deduce que (2) es una transformación 
biyectiva y que, además, la transformación inversa. 


PO E 
+ , 








> IFA +00 A 
Sd 
de determinante 
la _% 
Bci y +| la — E 
TA E ES 
3 
es también afín. 


o además de la transformación (2), se tiene otra transformación 
al 


x= bux +buy+b, 
y" =bux'+buy +ba 
de determinante 
y lbs ba 
bar bas 
el producto de estas transformaciones 
x= (Brra+br200)x + (11812 +D12002)y +(b1101 + bi909+b1), 
y” = (bay + baram)x+ (barra + barar)y +(bar01 + ba209+ ba) 
también será una transformación afín de determinante 
O 
ban +bean bars + barto 


igual al producto $* (que, por consiguiente, también será diferen- 
te de cero). 

Hemos obtenido de nuevo un grupo, el grupo de las transforma- 
ciones afines de un plano. Es fácil ver que la transformación afín (2) 
es el producto de la transformación (afín de centro) 

= aux + ay, 16) 


i 
Y = aux +amy 


0, 
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(a la que le corresponde en el espacio vectorial una aplicación lineal 
no degenerada) y de la traslación paralela T 

*x=%Í+0, 

y =J+w%. 

Puesto que ($ 4 del capítulo V) toda aplicación lineal no degene- 
rada es el producto de una aplicación autoconjugada €. (es decir, 
de una dilatación a lo largo de dos direcciones recíprocamente orto- 
gonales) y de una aplicación ortogonal W (es decir, de una rotación 
o de una simetría), podemos decir que toda transformación afín A 
es de la forma 

A=THC =QC 
(donde Q = TH es un movimiento), es decir, es el producto de una 
dilatación a lo largo de dos ejes recíprocamente ortogonales y de un 
movimiento. 


$5 6. Descomposición de un grupo por un subgrupo 


Consideremos primero el ejemplo siguiente. Sea G el grupo aditivo 
de los números enteros y sea Asu subgrupo formado por los números 
múltiplos de k. Descompongamos el grupo G en clases refiriendo 
a una misma clase los números que divididos por k dan el mismo 
resto. Luego, para que dos números x e y pertenezcan a una misma 
clase es necesario y suficiente que la diferencia de estos números sea 
divisible por k, es decir, que pertenezca a A: 

x-—y = kn€ A, de donde x = y+a siendo a€ A. 


Es obvio que de esta forma obtendremos k clases incluyendo el 
propio subgrupo A. 

Esta descomposición del grupo de los números enteros por el 
subgrupo de los números múltiplos de k se puede representar para 
k = 5 mediante el siguiente esquema 
—20, 15, —10,-5, 0, 5, 10, 15, 20, ... 

—19, —14, -9,-4, 1, 6, 11, 16, 21, ... 
-18, -13, —8,-3,2,7, 12,17, 22, ... 
-17, -12, -7,-2, 3, 8, 13,18, 23, ... 
[A+41.-.» 16, 11, 6-1, 4,9, 14, 19,24, ... 
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Introduzcamos la operación de adición en el conjunto de estas 
elases, Sean dadas dos clases B y C. Tomemos en cada una de estas 
clases un elemento (un representante), digamos b€B y c€C, 
sumémoslos y llamemos suma B+-C de estas clases a la clase que 
contiene la suma b-+c. Es importante, por supuesto, quela clase a la 
que pertenece la suma b+-c no dependa de cómo se escojan los 
representantes b y c en las clases B y C. Comprobemos que esto es 
así. Si b' también pertenece a B y c' € C, se tiene 

b-b'=km y c-c =km 
y por ello 

(b+0)—(b'+0c") = k(m4m2) 
es divisible por k, es decir, las sumas bc y b'+c' pertenecen a una 
misma clase. 

Porlo tanto, la operación de adición de clases que hemos definido 
no depende de la elección de los representantes en las mismas. La 
adición de clases es asociativa y conmutativa porque estas propieda- 
des se verifican para la adición en el propio grupo G. La clase 
coincidente con el subgrupo A desempeña el papel del cero, ya 
que podemos tomar al cero como representante de la clase A y siem- 
pre sé tiene g+-0 = g, donde g € G. Finalmente, para toda clase B 
existe la clase opuesta: si b€ B, la clase que contiene a —b será 
la opuesta de B, ya que 

b+(—b) =0€ A. 

El grupo (de clases) que hemos obtenido se llama grupo cociente 
del grupo de los números enteros respecto al subgrupo de los números 
múltiplos de k. Es, obviamente, un grupo cíclico de orden k. 

Apliquemos ahora una idea análoga en el caso general. Sea G 
un grupo arbitrario, esta vez multiplicativo, y sea A uno de sus 
subgrupos. Indiquemos por xA el conjunto de todos los elementos 
de tipo xa, donde a € A; este conjunto xA se denomina clase conti- 
gua por la izquierda del grupo G respecto al subgrupo A. 

Diremos que todo elemento y perteneciente a la clase xA es 
equivalente a x (escribiremos x — y). Señalemos las propiedades 
siguientes de este concepto: 

1. Todo elemento x es equivalente a sí mismo (x -- x), ya que 
x=xec xd. 

2. Si y —x, también x - y. Efectivamente, si y == x, es decir, si 
y EXA, se tiene y = xa, donde a€ A; luego x =ya”*E yA, es 
decir, x = y. 
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3.Sixw y e y =z, también x — z. Por hipótesis, x « y, €s 
decir, x = ya, e y — 2, es decir, y = 249, donde 01, da € A. Pero 
en este caso se tiene x = 2421 € zÁ y, por consiguiente, x = z. 

4.. Si los elementos x e y son equivalentes, sus clases contiguas xA 
e yA coinciden, Efectivamente, sea.x' € xA,es decir, x” — x. Puesto 
que x « y, resulta que x' «» y, es decir, x" € yA. Análogamente 
todo elemento y' de la clase yA pertenece también a xA y, por con- 
siguiente, XA = yA. 

5. Si los elementos x e y no son equivalentes, las clases xA e yA no 
tienen elementos comunes. Efectivamente, si zExAN yA, resulta 
quez xXx yz y; luego, x « y. 

Todo ei grupo G resulta, pues, partido en clases contiguas por la 
izquierda (sin elementos comunes) respecto al subgrupo 4 siendo 
el propio subgrúpo A una de estas clases. Si G es un grupo finito, 
todas las clases contiguas contienen un mismo número de elemen- 
tos (los elementos de la clase contigua xA corresponden biyectiva- 
mente a los elementos del subgrupo A, porque si xa, es igual a xaz 
resulta que 4, es igual a a). De aquí se deduce el siguiente teorema 
importante. 

Teorema de Lagrange. El orden de un subgrupo de un grupo 
finito es divisor del orden de este grupo. 

Demostración. Sea G un grupo finito de orden n y sea A su 
subgrupo de orden k. Realicemos la descomposición del grupo 
G en las clases contiguas por la izquierda respecto al subgrupo A. 
Sea j el número de las clases obtenidas; puesto que todas las clases 
constan de k elementos, resulta que el número total de elementos 
del grupo es 


n=kj 


y, por consiguiente, n es divisible por k. El número ¿se llama índice 
del subgrupo Á en el grupo G. 

Todo elemento g de un grupo G genera en éste un subgrupo 
cíclico (g) formado por todas las potencias de este elemento. El 
orden del subgrupo (g) se denomina orden del elemento g en cl 
grupo G..Debido al teorema de Lagrange resulta que el orden de 
todo elemento de un grupo finito es divisor del orden del grupo. 

Todo grupo finito cuyo orden es un número primo es cíclico, ya 
que el subgrupo cíclico generado por cualquiera de sus elementos 
(a excepción de e) debe coincidir con todo el grupo. 

Análogamente a la descomposición por la izquierda puede ser 
construida la descomposición por la derecha del grupo G respecto 
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al subgrupo A (en clases Ax). En el caso conmutativo ambas des- 
composiciones coinciden (es decir, constan de las mismas clases). 

En un grupo no conmútativo las. descomposiciones por la iz- 
quierda y por la derecha pueden resultar distintas. Consideremos, 
por ejemplo, la descomposición del grupo simétrico S3 respecto a su 
subgrupo B = (Pi, Pa). La descomposición por la izquierda está 
formada por las clases 


B,PsB = PB = (Pa, Po), PaB = PoB = (Po, Po) 
y la descomposición por la derecha consta de las clases 
B, BP == BP == (Pa, Po), BP; = BPs = (Pa, Ps). 


Al mismo tiempo, coinciden las descomposiciones por la iz- 
quierda y por la derecha de este grupo respecto a su subgrupo de 
tercer orden A = (P,, Ps, Pe): cada una de estas descomposiciones 
está formada por dos clases 


A=(Pi, Ps, Po) y B= (Po, Po, Pa). 


$7. Divisor normal 


Generalicemos. ahora la idea que nos ha conducido en el$ 6 al 
concepto de grupo de clases (grupo cociente del grupo aditivo de los 
números enteros). Sea A un subgrupo de un grupo cualquiera G. 
Formemos todas las clases contiguas por la izquierda del grupo G 
respecto al subgrupo A e intentemos de definir la operación de 
multiplicación de estas clases de la forma siguiente: dadas dos 
clases B y C, tomemos en cada una de ellas un representante bE B 
y c€C, multipliquemos estos representantes y definamos el pro- 
ducto BC como la clase a la que pertenece bc. Es preciso comprobar 
solamente si esta definición del producto de clases no depende de cómo 
se escojan los representantes de las mismas. Sea, pues, b' = b y 
€' = e; ¿será equivalente el producto »'c' a be? Tenemos, por 
hipótesis, b' = ba, y c' = cas, de donde resulta que b'c” = barcas. 
Si el grupo G es conmutativo, se tiene 


ac = ca 4) 


y b'c' = bo(aras), es decir, b'c” = be. 

En un grupo no conmutativo la igualdad (4), en general, no 
tiene lugar. Sin embargo, para nuestros fines es suficiente que se 
cumpla la siguiente condición más débil que la de conmutatividad : 
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es suficiente que el producto asc pueda ser representado en la forma 
caa, donde as es un elemento del subgrupo A diferente, en general, 
de ay. Si esto es así, tenemos b'c” = be(asa) y b'c' es equivalente a 
bc; luego el producto de clases no depende de cómo se escojan los 
representantes de las mismas. 

Por esto, aceptaremos ahora que el subgrupo A satisface a la 
condición siguiente: para todo elemento 4€ A y un elemento 
cualquiera g € G existe un elemento 4 € A tal que ag = gá. Esto 

significa que para todo a4€ A y cualquier g € G el producto 
gag =4€ A. Indicando por g”2Ag el conjunto de todos los 
elementos de tipo g”*ag, donde a € A, introduciremos el concepto 
siguiente. 

Definición 6. Un subgrupo A de un grupo G se llama subgrupo 
invariante o divisor normal de éste si 


gUAgS A 


para todo elemento g € G. 

Teorema 1. La intersección de dos divisores normales de un 
grupo G es también un divisor normal de G. 

Demostración. Sean A y Az dos divisores normales del grupo 
G y sea A = Ar (1 As. Sabemos que A es un subgrupo de G ($ 3). 
Ahora bien, puesto que AS Ar y AS 4), resulta que para 
cualquier elemento g € G se tiene 


gAgS gg S A 





g Ag S g” 48 < 42 
y, por consiguiente, 
gl cANn4=4, 
es decir, A es un divisor normal. 
Teorema 2, Para que un subgrupo A de un grupo G sea un divisor 


normal de éste es necesario y suficiente que para todo elemento 
g € G se cumpla la igualdad 


ge =4 o] 


Demostración. La suficiencia de la condición (5) resulta de la 
definición 6. Para demostrar la necesidad, supongamos que A es un 
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divisor normal del grupo G; para todo elemento g € G se tiene 
entonces 


gUAgS A 
y, por consiguiente, 

gAg? =(gy Ai S A. 

Por otro lado, tenemos 

A = ede = (8718) A(g"8) =8 (Ag) E S 87* Ag, 
es decir, A S g”*4g y, por consiguiente, g”1Ag = A. 

Teorema 3. Para que un subgrupo A sea un divisor normal de un 
grupo G es necesario y suficiente que coincidan las clases contiguas 


por la izquierda y por la derecha del grupo G respecto al subgrupo A. 
Demostración. De la igualdad 


giAg=A4 
resulta que 
Ag =84, 


es decir, para todo g € G coinciden Jas clases contiguas por la 
izquierda y por la derecha que contienen este elemento. 
Recíprocamente, si para todo g € G es 


Ag =g4, 
se tiene 
gUAg=A 
y 4 es un divisor normal. 


Por ejemplo, en el grupo simétrico Sael subgrupo A=(P;, Pa, Po) 
es un divisor normal, mientras que los subgrupos (Pi, Pa), 
(P1, Po) y (Ps, Pa) no son divisores normales de Sa. En un grupo 
conmutativo cualquier subgrupo es un divisor normal. 


$ 8. Grupo cociente 
Sean G un grupo cualquiera, A un divisor normal del mismo y S 


el conjunto de todas las clases contiguas del grupo G respecto al 
subgrupo 4 (recordemos que en este caso las clases contiguas por la 
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izquierda y por la derecha coinciden). Introduciremos en el conjunto 
S una operación de multiplicación tomando 


XA:yÁ = xyA. 


Puesto que A es un divisor normal, el producto xA-yA no 
depende de la selección de los representantes x e y de las clases que se 
multiplican. 

Demostremos que se ha obtenido 

1, La asociatividad de la multiplicación de las clase resulta de 
la asociatividad de la multiplicación en el grupo G: 

(x4-yA):zA = (xy) 4:24 = (xy) 24 = 

=x02) A = x4-(y2) A = xAYyA:24). 

2. El elemento unidad es el propio subgrupo A: 

A>xA =eA:xA =exA =x4, 

xA:A =xA:eA =xe4 = x4. 

3. La clase x”14 es la inversa de la clase xA, ya que 

XA :x1A =xx A =eA=A, 

XTUAxA =xUxA =€A =4A. 

El grupo obtenido se indica por G/A pp pnimias prns cociente 
del grupo G relativo al divisor normal A. 

El grupo cociente de un grupo conmutativo es conmutativo, ya 
que en este caso para dos clases cualesquiera se tiene 

xA:yA =(xy) A = (YX) Á = yA»xA. 


El orden del grupo cociente de un grupo finito es igual al índice del 
divisor norma! Á en el grupo G (y, por consiguiente, es un divisor 
del orden del grupo G). 

El grupo cociente del grupo simétrico Sa relativo a su subgrupo 
4 consta de dos elementos A = (Pi, Ps, Pa) y B =(Pa, Po, Pa) 
y es, por consiguiente, un grupo cíclico de orden dos (es fácil ver 
que B? = A). 

Ejemplo. Demuéstrese a 
de orden n (de elementos teals, por Semplo) es un dior normal el 
A de las matrices unimodulares (cs decir, de las matrices de determinante igual 
2 1) y determinese el grupo cociente G/A, 

Solución. a ya que el 
po e la inversa de una matriz unimodular. 
Son matrices unimodulares (teorema 3 del capitulo HID. 
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Además, el subgrupo A de las matrices unimodulares es un divisor normal 
deG: maine o y, do comino ll la para toda matriz g € Use 
tiene 

leg i=187"11allel =1g1"Mallgl=1lal=1, 
es decir, 

Ea. 

Determinemos el grupo cociente G/A. Demostremos, ante todo, que una 
condición necesaria y guiente para que dos maties by pertenetan 9 una 
misma clase contigua del grupo G respecto al divisor normal 4 es que sus deter- 
minantes scan iguales. Efectivamente, si 6 -- c, es decir, al 5 =ca, donde 
a € A (y, por consiguiente, jal = 1), tenemos 15] = |cl Jal = le]. 

Reciprocamente, si |6|-= |cl, se tiene b = (c=16), donde 


le71b] =|e7*] 16] =Jel=2151=1 
y, por consiguiente, c” lb € A, es decir, b = e. 
porro G respecto de A se caracteriza 


plenamente 
sos el valor del deserniuents de las metriess que la componen. La multiplica» 
sión de eses cocrencadó a multiplicación de cualesquiera representantes 


el grupo cociente GÍA es isomorfo al grupo multiplicativo de las números reales 
diferentes de cero. 


$ 9. Divisores normales del grupo de transformaciones de 
un plano euclídeo y sus correspondientes grupos cocientes 
A. Ejemplos da divisores normales 


1..El grupo de traslaciones paralelas es un divisor normal del grupo de movi- 
mientos de un plano. 
Di 


paralela. Sean A y B unos puntos arbitrarios del plano; supongamos que 
4 41D2 T eotaramormación O; 
A! 47 y B' — 8" enla transformaci 
A" +A” y B"-B" en la nnalormación o. 

En estas condiciones resulta que 
A — A" y B -- B" enla transformación Q-"79 

(A. 31), Debemos demostrar que el segmento 44” es igual y paralelo al seg» 
mi” Menslormación Q=* TQ es un movimiento; luego 
A"B" =AB. (6) 
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ES 
ñ Fig. 31 


Puesto que para el movimiento Q el punto A - A' y el punto 4” A”, 
tenemos 


AÑ A m 
y como, ademas, en este caso el punto B => B” y el punto B”” —= B”, tenemos 
también 

BB" = BP". (8) 
Por otro lado, T'es una traslación paralelo, luego 

XA" =BB". (9) 
Dolas igualdades (7), (8) y (9) resulta que 

AA” m BB (0) 


y de las pas (6) y (10) se deduce in len B"Bes hn 
Jariclogtamo y, le dee dalla 
TO es uns vilación o , 


2. £l grupo de lar traslaciones paralelas es también un divisor normal del 
grupo de las afines. 

Demostración. Sea-4 una transformación afín cualquiera y sea 7 una trasla- 
ción paralela. Debemos demostrar que la transformación 474 es una trasla- 
ción paralela, 

En el $ $ hemos demostrado que toda transformación afín A se puedo re- 
presentar cala forma A > QC, donde ( es uo movimiento y € esunatransfor. 
mación autoconjugada. Pero entonces resulta que 

ATITA = (QC)J (QC) = C-UQTD)C. 

El producto (TO = Tes, según hemos demostrado en el p..) una tasla- 
ción paralela. Consideremos la transformación C-*7"C. Supongamos que el 
sistama de coordenadas se ha escogido de forma que la transformación €, 
transforma el punto A(x, y) en el punto A'(A,x, 44); la traslación paralela 7” 
de vector (a,, as) transformará el punto A' en el punto 4”(A,x+a,, 42y+ 05). En 
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estas condiciones, la transformación C”* transformará el punto A” en el punto 


az +2) y, por consiguiente, la transformación C“"7'C es una 
: 
traslación paralela de vector (553. 

3, El grupo de las traslaciones paralelas también es un divisor normal del 
grupo de las transformaciones de semejanza, ya que este último es un subgrupo 
del grupo de los transformaciones afines, 

“4. El grupo de los movimientos es un divisor normal del grupo de las trans- 
formaciones de semejanza. Efectivamente, sea U una transformación de seme- 
Janza cualquiera y sea Q un movimiento. En este caso U="QU es una transfor- 
mación de semejanza que no altera las longitudes de los segmentos (en la 
transformación U todas las longitudes se multiplican por k, en la transforma- 
ción Q no varían y en la transformación U”! se multiplican por k”') y es, por 
consiguiente, un movimiento. 


B. Grupos coclentes 


1. El grupo coclente del grupo Y. de transformaciones afines respecto al sub= 
grupo 6 de traslaciones. E 

Dos transformaciones afines A, y A, son equivalentes (es decir, pertenecen 
a una misma clase respecto al subgrupo (5), si, y sólo si, A, = TAp, donde T 
es una traslación paralela, Si A es una transformación afín itraria que 


deja fijo el punto O, es equivalente a A: To1pA -- A, Por consiguiente, toda 
transformación afín es equivalente a una transformación afín de punto fijo O. 
Por otro lado, si dos transformaciones afines A; y A, dd punto fijo O son equiva- 
lentes, es decir, 4, = TA, resulta que el producto A,45* == T€s una trasla- 
ción paralela de punto fijo O es decir, es la transformación idéntica 


AAr!=E, 


representado como 

X= Ox HOY, 

Y = Oax +0, 
donde el determinante 3 74 0; luego, es isomorfo al grupo de las matrices no 
degeneradas de 


orden. 
2. El grupo cociente del grupo Y de las transformaciones de semejanza rela- 
las traslaciones paralelas. 


el grupo cociente 9/8 es isomorfo al grupo de las transformaciones de seme- 
janza de centro O. Pero toda transformación de este tipo puede ser represen- 
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tada como el producto KH de una transformación ortogonal H y de una homo- 
tecia K con ua coeficiente determinado k >+ 0 (véase la pág. 262). Es verdad 
que esta representación no es unívoca. Si S es una simetría de centro O, se 
tiene NM =Ey 


KH = KS'H = (KS)(SH), 


¿onde SH es jambiéa una transformación ortogonal y KS es una homotecia de 
coeficiente —k. Porllo, podemos limitarnos á considerar las descomiposiciones 
detipo KH, donde K es una homotecia de coeiciate positivo, Esta representa: 
ción de una transformación de semejanza de centro será ya unívoca, porque de 
Ja igualdad 

Ki, = KyHr (D 
resulta 

KK = Ha 


luego la homotecia Xy 1K, de coeficiente ly /kz > 0 será también una (ranaor. 
mación ortocaal (que 1, vaca las Iomelendes de los seginenios), de modo 
que k/Ka = 1h 5 a. 5 decir, Ka = Ka. Do aquí y de la igualdad (11) resulta 
que también H, = Ha. 

Por consiguiente, obtenemos un sistema completo de representantes y] 
todas las clases de la descomposición del grupo Y respecto al divisor normal 6. 
si tomamos todos los a sb de tipo KH, doce HH es una transformación 
ortogonal y K es una homotecia de cocficiente £ > O. Luego, el grupo cociente 
E/8 es ¡Somorto al grupo de las matrices de tipo kh, donde h es una matriz 
ortogonal de segundo orden yk s un número 

3. El grupo cociente del grupo de los movimientos relativo al subgrupo de las 
traslaciones paralelas es isomorfo al grupo de los smovientos de punto fijo, 
es decir, es isomorfo. ha de las matrices ortogonales de orden dos, 

grupo de de las poison de semejanza % 
relativo al subgrupo Wi de los mos 


Para toda transformación pr semejanza existe una equivalente transfor- 
mación de semejanza de centro O. Cualquier transformación de este tipo se 
puede representar como al producto KH, donde Fes una transformación orto- 
gonal y Kes una homotecia de coste > 062 '), Silos transformaciones 
K,H, y K¿H, son equivalentes, se tiene K,H; = K,H,0, donde Q es un movi- 
miento; ¿omo la homotecia K; *K, = MQM;* de coeficiente k;/ky > 0 no 
varia las longitudes de los segmentos (por ser un y movimiento), resulta que 
Ks)k, = 1, de donde K, = K;. Reciprocamente, si Ke las transfor- 
maciones KH, y KH, son equivalentes, porque pa estr, do donde 
"movimiento. Por consiente, obtenemos un 
de representantes de la descomposición del grupo Y Féspecio al subgrupo E 
tomando, a id centro O y de coeficiente posi- 
tivo. Por el e erapa cociente BAR esisomorfo al grupo mudtiplicativo de los 
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Gmurman V. 
OBRA DE REFERENCIA PARA RESOLVER LOS 
PROBLEMAS 


DE LA TEORIA DE LAS PROBABILIDADES Y 
DE LA ESTADISTICA MATEMATICA 


Por su cóntenido, esta obra corresponde al curso 
de la teoría de las probabilidades y de estadística 
matemática y contiene más de 500 problemas para 
todas las partes del curso. Al principio de cada párrafo 
el autor expone los conocimientos teóricos necesarios, 
las fórmulas requeridas y muestra los ejemplos cómo 
resolver problemas típicos. Los problemas destinados 
para resolverse independientemente se dan según sus 
dificultades crecientes. Además de los problemas clási- 
cos acerca de lanzamientos de monedas o dados, este 
libro contiene ún gran número de problemas que ilus- 
tran la aplicación de la teoría de las probabilidades en 
la técnica (fabilidad, control estadístico de la calidad 
de producción y tratamiento de los datos experimen- 
tales). El mérito fundamental de este libro consiste 
en que el autor, en todos los problemas, pone en pri- 
mer plano su esencia probabilística, reduciendo al 
mínimo el cálculo numérico. 

Esta obra puede servir para enseñar a resolver los 
problemas de la teoría de las probabilidades, de esta- 
dística matemática y para los estudiantes de las espe- 
cialidades ingeniero-técnicas y económicas. 


ACABA DE APARECER 


¡Gmurman Y. 


LA TEORIA DE LAS PROBABILIDADES Y 
LA ESTADISTICA MATEMATICA 


Este tratado ha sido escrito de conformidad con el 
o probabilidades y de 
la estadística matemática. El material de esta obra 
se presenta en tres partes fundamentales: las dos 
primeras se dedican a la teoría de las probabilidades 
y la última, a la estadística matemática. En este manual 

se estudian los temas siguientes: probabilidad de las 
po fórmulas de Bayes; distribución de Poisson; 
nociones de la estadística matemática y noción de 
correlación. 

La cuarta edición de este libro contiene algunos 
capítulos nuevos: distribución 
ción de las hipótesis estadísticas y análisis dispersional 
uniforme. 

En el libro se presta gran atención a los métodos 
estadísticos de elaboración de los datos experimentales; 
las tablas que se exponen para los cálculos son muy 
cómodas. Cada capítulo contiene problemas y sus 
respuestas que han sido elegidos adecuadamente. Ade- 
más, todo capítulo ya acompañado del análisis de las 
cop de los problemas del material correspon- 

ente. 

Esta obra contiene diecisiete capítulos, varias 
tablas de números, veintidós figuras y un gran número 
de ejemplos teóricos y técnicos; se recomienda para 
los eetaciantesido las faculiodes ingeniero-técnicas y 
económicas. 


